Добавлено: Чт Фев 01, 2007 4:55 pm Заголовок сообщения: Репрезентативность выборки и выбор маркеров качества поиска
Наш последний анализатор качества выдачи после апдейта понравился Яндексу. Они прислали письмо с одобрением идеи и высказали ряд справедливых замечаний. В частности:
- нерепрезентативность выборки, т.е. попросту мало маркеров,
- неверное определение некоторых маркеров. Например, в первой версии анализатора для запроса "поисковые системы" в качестве маркера был выбран сайт Рамблера. И раз уж качество считается по средней позиции маркера, почему вдруг Яндекс и Гугл должны ставить Рамблер на первое место по такому запросу.
Список пар "запрос-маркер" мы постарались увеличить и исправить. Вот новый список:
auto.ru - автомобили
anekdot.ru - анекдоты
exler.ru - экслер
rambler.ru - рамблер
yandex.ru - яндекс
google.ru - гугл
job.ru - работа
marketing.spb.ru - маркетинг
mosokna.ru - московские окна
yellowpages.ru - желтые страницы
gismeteo.ru - погода
kremlin.ru - президент
lib.ru - библиотека
artlebedev.ru - лебедев
amik.ru - квн
ergosolo.ru - соло на клавиатуре
urikor.net - слепая машинопись
microsoft.com - microsoft
vaz.ru - автоваз
vashdom.ru - ваш дом
nge.ru - нефтепродукты
ambmosca.esteri.it - посольство Италии
moscow.usembassy.gov - посольство США
ru.wikipedia.org - википедия
lenta.ru - лента
yaca.yandex.ru - каталог яндекса
rbc.ru - рбк
rs.ru - русский стандарт
irr.ru - из рук в руки
sport-express.ru - спорт-экспресс
kp.ru - комсомольская правда
ng.ru - независимая газета
izvestia.ru - известия
forum.searchengines.ru - форум о поисковых системах
oborot.ru - оборот
1c.ru - 1с
bitrixsoft.ru - битрикс
ashmanov.com - ашманов
kaspersky.ru - касперский
kazan.org.ru - казань
mos.ru - москва
gov.spb.ru - санкт-петербург
ntv.ru - нтв
museum.ru - музей
panavto.ru - панавто
gum.ru - гум
daewoo-electronics.ru - daewoo
mercedes-benz.ru - мерседес
toyota.ru - тойота
msu.ru - мгу
mvdinform.ru - мвд
gai.ru - гибдд
evening-kazan.ru - вечерняя казань
sovsport.ru - советский спорт
1001.vdv.ru - шахиджанян
adlabs.ru - адлабс
sotovik.ru - сотовик
kls.ksu.ru - казанская лингвистическая школа
eralash.ru - ералаш
nalog.ru - налоги
jvanetsky.ru - жванецкий
aif.ru - аргументы и факты
1september.ru - первое сентября
aport.ru - апорт
webplanet.ru - вебпланета
rzd.ru - железные дороги
coelho.ru - коэльо
zadornov.net - задорнов
litera.ru - литература
religare.ru - религия
hristianstvo.ru - христианство
islam.ru - ислам
moscowzoo.ru - московский зоопарк
aeroflot.ru - аэрофлот
sbrf.ru - сбербанк
mchs.gov.ru - мчс
akhmatova.org - ахматова
tsvetayeva.com - цветаева
mon.gov.ru - министерство образования
pobediteli.ru - победители
gazprom.ru - газпром
lukoil.ru - лукойл
tatneft.ru - татнефть
kuklachev.ru - куклачев
linux.ru - linux
pravoslavie.ru - православие
citibank.ru - ситибанк
sexology.narod.ru - сексология
Если есть возражения по поводу какого-то сайта, почему он не может быть маркером по запросу и претендовать на первую позицию по нему или пожелания новых пар запрос+маркер - давайте. _________________ С уважением,
Андрей Иванов.
gameslife.ru - игры
chemax.ru - коды
dating.ru - знакомства
sport-express.ru - спорт
manchester-united.ru - manchester united
bmw.ru - bmw
www.mail.ru - почта
Кажется, завтра=послезавтра мы до 130+ маркеров доберемся уже.
Запросы по темам делиться будут?
Чтоб товаров, услуг, и чисто информационных сайтов было примерно поровну. _________________ "Все сходно, тождественно, различно." (С)
"Любое "Я" - множественно."(С)
Кажется, завтра=послезавтра мы до 130+ маркеров доберемся уже.
Запросы по темам делиться будут?
Чтоб товаров, услуг, и чисто информационных сайтов было примерно поровну.
Пока не в планах. В этой базе мы пытаемся найти именно "самоочевидные" маркеры. Что можно показать на первой позиции по запросу "посольство США", или "Яндекс" и т.п. _________________ С уважением,
Андрей Иванов.
Зарегистрирован: 23.07.2005 Сообщения: 34 Откуда: C Алтая
Добавлено: Пт Фев 02, 2007 7:41 am Заголовок сообщения:
andre писал(а):
Наш последний анализатор качества выдачи после апдейта понравился Яндексу. Они прислали письмо с одобрением идеи и высказали ряд справедливых замечаний.
А мне не понравился:)
По-моему, в принципе гнилая идея для практической реализации.
Что-то вроде деления на "белую кость, голубую кровь" и "сволочей".
А если тот же Яндекс воспользуется этой идеей и проставит свои "маркеры"?
И будет выдавать маркированные сайты на первых местах?
А где гарантия, что через месяц-год не появится сайт, более соответствующий, чем, скажем, auto.ru?
Два маркера прикажете ставить?
Тогда где предел маркерам?
Весь серп забьем "маркированными сайтами"?
И кто определять будет, кто достоин маркирования?
Яндекс, Ашманов с партнерами, лично Андрей Иванов?
Или референдум устроим?
Нет, именно как "анализатор качества" в теоретическом и научном плане- идея может быть и здравая и интересная.
Только опасная.
Если этот "анализатор" получит широкую известность и завоюет определенный авторитет среди "широких слоев населения", то уж больно велик будет соблазн у поисковиков "чуть-чуть" подкрутить выдачу, чтобы козырнуть, вот мол, какие мы, даже Анализатор (с большой буквы) ставит нам плюсики.
Добавлено: Пт Фев 02, 2007 9:37 am Заголовок сообщения:
ask812 писал(а):
И кто определять будет, кто достоин маркирования?
Яндекс, Ашманов с партнерами, лично Андрей Иванов?
Или референдум устроим?
Нет, именно как "анализатор качества" в теоретическом и научном плане- идея может быть и здравая и интересная.
Только опасная.
Если этот "анализатор" получит широкую известность и завоюет определенный авторитет среди "широких слоев населения", то уж больно велик будет соблазн у поисковиков "чуть-чуть" подкрутить выдачу, чтобы козырнуть, вот мол, какие мы, даже Анализатор (с большой буквы) ставит нам плюсики.
Ну а дальше сами фантазируйте.
Вы, собственно, уже на референдуме присутствуете. Впрочем, чтоб было действительно репрезентативно, нужно набросать таких пар запрос-сайт несколько тысяч и маркеры выбрать случайным образом. Готовы выдать столько пар? Если нет, то какие могут быть претензии к тем, кто предлагал свои пары?
По такому же приниципу обсчитывается индекс Доу-Джонса на бирже. Да, он влияет на деловую активность самим фактом своего существования. И компании при его обсчете кто-то как-то отбирал. Что не гарантирует подделок отчетности, корпоративных скандалов и т.п.
Но это не говорит о том, что индекс Доу-Джонса не нужен для экономистов.
Зарегистрирован: 23.07.2005 Сообщения: 34 Откуда: C Алтая
Добавлено: Пт Фев 02, 2007 11:00 am Заголовок сообщения:
spark писал(а):
Вы, собственно, уже на референдуме присутствуете.
Я бы не стал называть мнение случайно собравшихся СЕОшников "референдумом".
Нерепрезантативная выборка, так сказать:)
spark писал(а):
Впрочем, чтоб было действительно репрезентативно, нужно набросать таких пар запрос-сайт несколько тысяч и маркеры выбрать случайным образом. Готовы выдать столько пар? Если нет, то какие могут быть претензии к тем, кто предлагал свои пары?
Причем тут несколько тысяч пар и случайная выборка?
Если мы говорим про запрос "Посольство США", какие могут быть тысячи и случайности?
Посольство Непала, что ли, случайно из тысячи выбрать?
Насколько я понял, речь идет об учете мнения "широких масс" юзеров, далеких от сеошной байды и прочих тонкостей.
А также некоторых объективных принципах.
Если про Авто.ру можно поспорить, то про посольство уже не поспоришь, оно одно.
Так вот дальше я пишу о том, что может вызвать споры.
spark писал(а):
По такому же приниципу обсчитывается индекс Доу-Джонса на бирже. Да, он влияет на деловую активность самим фактом своего существования. И компании при его обсчете кто-то как-то отбирал. Что не гарантирует подделок отчетности, корпоративных скандалов и т.п.
Но это не говорит о том, что индекс Доу-Джонса не нужен для экономистов.
Я говорил, собственно, несколько о другом.
Сейчас, например, положение сайта в выдаче поисковиков напрямую влияет на его благополучие.
Отсюда возникла целая отрасль "оптимизации", белой, черной, серой и зеленой в крапинку. С неплохими оборотами, кстати.
Немного поменьше, но влияет положение в рейтингах, например, в ТОП100 Рамблера.
Отсюда скрипты-кликальщики, накрутчики и прочая фигня.
А вот если в массовом сознании укоренится мысль, что хороший поисковик - это поисковик, который хорошо оценивается "Анализатором", что из этого получится, догадайтесь с 3-х раз:)
Правильно, у поисковиков появится желание "оптимизировать" выдачу под "Анализатор"!!!
А сам принцип анализа - гнилой, волюнтаристский.
Захочет Андрей Иванов включить auto.ru в выборку для оценки - включит. Не захочет - не включит, мнения насчет auto.ru могут быть самые разные, между прочим.
Оценка "массового сознания" на глазок - фигня полная.
Кстати, я вижу, уже предложения пошли включить то-то и то-то.
А если "Анализатор" заимеет вес в Рунете, то и просьбы пойдут, а потом и попытки подкрепить просьбы хрустящими бумажками:)
Но это так, к слову...
Вот если бы для анализа использовался какой-то другой принцип, а не метод "референдума", "голосования" или "я начальник, я так решил" - вот это было бы замечательно.
"Научные задачи не решаются голосованием" (С) Не-помню-кто.
Тот же ТОП100 использует посещаемость. В первом приближении вполне объективно.
Но вот для определения РЕЛЕВАНТНОСТИ совершенно не годится!
Идеальным вариантом был бы семантический анализ (причем не отдельной страницы, а сайта целиком), но задача семантического анализа пока не решена. И вряд ли будет решена в обозримом будущем.
Андрей, я в свое время, уже лет 5 назад, интересовался твоим проектом "Нейрон", изучал идеи, туда заложенные, и знаешь, не в обиду тебе будь сказано, еще тогда отнесся к ним довольно скептически.
Понимаешь, и в Нейрон и в Анализатор заложены принципы СУБЪЕКТИВНОЙ оценки.
А такие оценки меняются и во времени и по социальному составу оценщиков и вообще черт знает как еще!
Это зыбкое болото, а не точная оценка.
И возможностей для манипулирования результатами здесь на порядок больше, чем при самой хреновой, но объективной оценке.
Приведу далекую от темы аналогию, прошу не ругать за это:)
Вот сейчас все говорят: "коррупция, коррупция".
А в основе-то ее - безграничная возможность чиновника решать, что хорошо, что плохо, что вредно, что полезно и т.д.
Субъективно решать, волюнтаристски.
Вот и получается хорошим то, за что отбашляли.
Манипуляция "результатами выдачи" решений власти.
Еще раз повторяю, как научная идея - "анализатор" хорош.
Я просто хочу сказать, что он не для массового пользования, так же как рабочие чертежи ядерной бомбы. Только и всего:)
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете голосовать в опросах