• ↓
  • ↑
  • ⇑
 
Записи с темой: ya.ru:author:24856902 (список заголовков)
12:27 

Облачные фотографии на Земле

Каждый день пользователи Яндекс.Диска автоматически сохраняют несколько миллионов фотографий, сделанных в самых разных местах. Мы проанализировали обезличенные данные по снимкам 2014-2015 годов и увидели, когда и где люди чаще фотографируют.

Летние фотографии с мобильных устройств
По клику на изображение откроется полная карта фотографий. Сезон можно выбрать в левом верхнем углу.

По данным Яндекс.Диска

В любое время года много снимков из крупных городов России, Украины и Беларуси. В Европе круглый год снимают Париж и Прагу, а летом — ещё Барселону и Рим. Кроме того, на карте хорошо видны курорты. Зимой становится больше фотографий из Юго-Восточной Азии, а летом — из Европы, с Чёрного и Средиземного морей.
Вот так, например, выглядит побережье Турции в разные времена года:


О том, когда больше всего фотографируют, читайте в небольшом исследовании по данным сервиса Яндекс.Диск.

.


@темы: ya.ru:author:24856902, ya.ru:text, Диск, исследования

11:28 

Объединённые карты в новом интерфейсе

Сегодня мы представляем новые Яндекс.Карты. Во-первых, сервис сменил интерфейс. Это видно сразу: теперь самое главное — карта — занимает всё окно браузера. Панорамы тоже открываются на полном экране: ничто не будет отвлекать вас, скажем, от изучения изразцов на стенах ярославской церкви Иоанна Предтечи в Толчкове или туннеля Кругобайкальской железной дороги. Карточки объектов научились не только подсказывать адрес, но и показывать, как улица выглядит на панорамах, — так проще найти нужный дом. Заодно карточка поможет построить до места назначения маршрут. Если вариантов проезда несколько, их можно сравнить прямо на карте и выбрать самый удобный.


Впервые новый интерфейс Яндекс.Карт мы показали в октябре 2013 года. До сегодняшнего дня он был доступен в бета-версии.

Андрей Кармацкий, руководитель службы дизайна геоинформационных сервисов:

Андрей Кармацкий, руководитель службы дизайна Яндекс.КартМы начали работать над новым дизайном Яндекс.Карт в марте 2013 года. До этого мы собрали статистику и отзывы по текущему интерфейсу и выяснили, для чего люди чаще всего используют карты и как они с ними взаимодействуют. Если кратко, то основные сценарии такие: посмотреть карту, посмотреть пробки, найти конкретное место или организацию, построить маршрут, сохранить или распечатать карту. Эти сценарии нам было важно заложить в новый интерфейс в первую очередь. Кроме того, работая над Картами, мы осознали ещё одну важную вещь: собственно интерфейса на сервисе должно быть мало, а контента — карт и панорам — много. И стали чуть более критично смотреть на количество кнопок на экране.

Все гипотезы мы ещё раз проверили, проанализировав и кластеризовав несколько тысяч пользовательских сессий, и в октябре 2013 года запустили бета-версию Яндекс.Карт. С тех пор многое дополнилось и улучшилось, и наконец новый интерфейс стал доступен всей аудитории сервиса на всех устройствах — компьютерах, планшетах и смартфонах. Сейчас на Картах всё ещё нет некоторых возможностей и инструментов, которые были в старом интерфейсе, но мы ни о чём не забыли. Мы хотим оценить их востребованность и действительно нужные вернуть, сделав их лучше.

Второе изменение на сервисе касается содержимого карт. Мы начинаем объединять карты, над которыми работают профессиональные картографы, и Народную карту, над которой работают пользователи. В результате на сервисе появятся подробные схемы всех городов России, больших и маленьких. Посмотреть схемы можно и сейчас — на слое «Народная карта», но после объединения пользователи смогут строить по улицам всех населённых пунктов маршруты.

Сама Народная карта превращается в редактор Яндекс.Карт — ссылка на него находится в меню, обозначенном буквой "i", в левом нижнем углу. Теперь поучаствовать в обновлении Яндекс.Карт могут все желающие. С помощью редактора можно отметить на карте любые изменения вокруг: например, снесённый дом или только что построенную школу.

Никаких специальных навыков для редактирования карты не требуется, внести правку можно за считанные минуты. Все исправления проходят модерацию и после этого появляются на Картах. Обновления будут происходить каждый месяц.


Павел Гущин, руководитель проектов Яндекс.Карт:

Павел Гущин, руководитель проектов Яндекс.КартВ штате Яндекса есть профессиональные картографы. Они работают над созданием и актуализацией наших карт. Но разумеется, мы не можем уследить абсолютно за всем, что происходит в городах страны. А что-то меняется каждый день: появляются новые здания, исчезают старые, открываются магазины и детские сады. Первыми обо всех изменениях узнают жители ближайших районов — и они же могут сообщить об этом миллионам пользователей, внеся уточнение в редакторе

Яндекс.Карты доступны на сайте maps.yandex.ru и в виде мобильных приложений — например, Карты, Навигатор, Транспорт, Парковки, — для разных операционных систем. Мы очень ждём ваших комментариев и пожеланий. Пожалуйста, пишите нам, что вы думаете о новых Картах.

.


@темы: ya.ru:author:24856902, ya.ru:text, Карты

12:06 

Интернет в регионах России

Яндекс выпустил очередное — уже восьмое по счёту — исследование, посвящённое интернету в России. Задача исследования — отобразить основные показатели развития интернета: как в отдельных регионах, так и в стране в целом. Для этого мы используем информацию из нескольких источников. Это данные от сервисов Яндекса — например, Метрики и Справочника Яндекс.Карт, — а также сведения от Фонда «Общественное мнение», исследовательской группы TNS и компании GfK.

В 2014 году аудитория интернета в России составила 72,3 миллиона человек — именно столько людей выходили в сеть хотя бы раз в месяц. 83% из них пользовались интернетом каждый день. Темпы роста аудитории сохранились на уровне 2013 года: за год в стране появилось 6 миллионов новых пользователей. По проникновению интернета — то есть доле интернет-пользователей среди населения — Россия опережает другие страны СНГ и Грузию.

Среди отдельных регионов проникновение интернета выше всего в Москве и Санкт-Петербурге. Там в сеть хотя бы раз в месяц выходят 77% населения. Самый низкий уровень проникновения интернета, 57%, — в Приволжском федеральном округе.

Всё больше людей выходят в интернет со смартфонов и планшетов. Если в 2013 году доля мобильных пользователей среди всех пользователей интернета составляла 56%, то в 2014 году — уже 68%. Самое высокое в стране проникновение мобильного интернета — в Северо-Кавказском федеральном округе, а самое низкое — на Урале. У владельцев мобильных телефонов самой популярной платформой остаётся Android, а на планшетах по-прежнему лидирует iOS.

Самый дорогой в стране интернет — на Дальнем Востоке. Тарифы на мобильный интернет там начинаются от 530 рублей в месяц. Фиксированный широкополосный доступ в сеть стоит в среднем 600 рублей, и скорость загрузки при этом относительно невысока — всего 4 Мбит/c. Самый быстрый фиксированный интернет — в Санкт-Петербурге и Москве. Он же один из самых дешёвых: на скорость в 15-20 Мбит/с в столицах можно рассчитывать за 300 рублей абонентской платы.

Подробнее об этих и других показателях развития интернета в России читайте в полном тексте исследования. Бюллетени за предыдущие года можно найти здесь.

.


@темы: ya.ru:author:24856902, ya.ru:text, исследования

14:20 

Карты по интересам

Недавно мы выпустили исследование про то, что люди ищут в связи с разными странами. Для него мы проанализировали более 200 тысяч случайных запросов автоматически и около 25 тысяч — вручную. В результате исследование получилось очень большим, и всё равно осталось ещё много интересного.

Например, мы посчитали, сколько запросов по определённым темам задают о разных странах, и нарисовали карты. Чем темнее закрашена страна, тем больше про неё запросов по каждой теме, то есть — тем сильнее ей интересуются в связи с этой темой. Интерес людей показывает, насколько сильно влияние каждой страны в определённой области.

Скажем, туризм. Больше всего запросов об отдыхе в Египте, более 900 тысяч в месяц. Следующие по привлекательности страны — Турция, Таиланд, Белоруссия, Финляндия и Вьетнам.


По клику на изображение можно перейти на полные карты. Нужную тему выберите в правом верхнем углу.



Или кино. Индийские и турецкие фильмы и сериалы вне конкуренции, о них спрашивают ещё больше, чем об отдыхе в Египте — более 1,3 и 1,1 миллиона запросов в месяц соответственно. Индийское кино ищут больше, чем американское, корейское и французское вместе взятые.


По распространению национальных кухонь лидируют Грузия, Китай и Узбекистан. Но вообще кулинарные предпочтения пользователей Яндекса очень разнообразны — среди стран, про которые часто спрашивают в связи с кулинарией, есть и страны Закавказья, и азиатские, и европейские.



Другие карты (эмиграция, музыка, порно и т.д.) смотрите здесь, а всё остальное про разные страны в поиске Яндекса — читайте в исследовании..


@темы: ya.ru:author:24856902, ya.ru:text, Поиск, исследования

14:46 

Перевод часов и его последствия

Люди пользуются интернетом всегда приблизительно в одно и то же время. Различия есть только между разными днями недели, а все понедельники выглядят примерно так:

Активность пользователей интернета по времени суток (понедельник)

Одно из немногих событий, которое влияет на время активности людей в интернете, — это перевод часов. Перед переходом на постоянное зимнее время, который состоится уже в эти выходные, мы посмотрели, как менялась активность людей в интернете в прошлые разы. После 31 октября 2010 года и после 27 марта 2011 года.

Сразу после перевода часов, в воскресенье, люди продолжают жить по старому времени. Весной день у пользователей интернета начинается на час позже, а осенью — на час раньше. К понедельнику эта разница сокращается примерно до 10-20 минут, а к пятнице исчезает совсем.

Весенний перевод часов (2011 год)

К осеннему переводу часов, когда ко сну добавляется дополнительный час, люди приспосабливаются значительно проще и быстрее.

Осенний перевод часов (2010 год)

.


@темы: ya.ru:author:24856902, ya.ru:text, исследования

12:09 

Поиск как поваренная книга

Около 2% запросов к Яндексу так или иначе связаны с кулинарией. Они очень разнообразны – люди ищут всё, начиная с рецептов для мультиварки и заканчивая калорийностью борща. Мы проанализировали поисковые запросы со словами «рецепт», «что приготовить» и «как приготовить» и выяснили, что готовят пользователи поиска. Все данные – за период с 25 августа по 7 сентября 2013 и 2014 года.

Больше всего рецепты ищут днём – в районе 16:00. Думать о том, что приготовить, люди начинают в районе шести утра, а к часу ночи запросов про рецепты становится совсем мало. Кроме того, люди меньше ищут рецепты собственно во время еды – обеда, который бывает около двух, и ужина, часов в шесть.



Среди поводов, для которых люди ищут рецепты, с большим отрывом лидируют ужины — обычные, романтические и для любимых. Потом идут обеды, дни рождения и завтраки. Зато ночью и ранним утром – примерно с двух ночи до шести утра – завтраки более востребованы.

Чаще всего люди не знают, что им приготовить из мяса (всех видов). По крайней мере, в запросах вида [что приготовить из] чаще всего встречается именно мясо. Большинство остальных продуктов, которые в начале осени ставили пользователей в тупик, – сезонные.

Сколько запросов о рецептах задают люди каждый день, что предпочитают готовить «на зиму», на сколько за год стало меньше запросов о рецептах для мультиварок и другие факты ищите на странице исследования.

.


@темы: ya.ru:author:24856902, ya.ru:text, Поиск, исследования

12:46 

Чем интересуются пользователи поиска

Каждый месяц поиск Яндекса отвечает на 5 миллиардов поисковых запросов из России. По данным TNS, его использует три четверти интернет-аудитории и почти половина населения страны. Таким образом, по поисковым запросам к Яндексу вполне можно судить об интересах всех российских пользователей интернета.

Мы проанализировали случайную выборку поисковых запросов — 15 тысяч запросов с сентября 2013 по май 2014 — и написали на их основе новое большое исследование о поиске Яндекса. Оно рассказывает о том, что и как ищут жители российских городов разного размера. Разумеется, все данные обезличены.

С самого начала мы постарались отказаться от любых гипотез и ожиданий, просто смотрели на поток запросов. В результате в ходе анализа сложилась классификация, которая включает три уровня: цели запросов, темы и сферы жизни, к которым они относятся.

Цель запроса — это то, что хочет получить пользователь от взаимодействия с поисковой системой. Поиск используют с тремя основными целями. Во-первых, как навигатор в интернете — для перехода на сайты (например, [авито], [vk.com], [переводчик онлайн]). Во-вторых, для получения информации ([как сажать розы осенью], [очепятка что это], [к чему снится работа]). В-третьих, для поиска контента ([терминатор смотреть], [танки онлайн играть], [антивирус скачать бесплатно]). Для каждого из трёх вариантов можно выделить часто встречающиеся типы запросов. Например, для поиска контента это будет видео, аудио, игры и т.д.

Тема запроса — это то, о чём спрашивает пользователь: автомобили, спорт, домашние животные и т.п. Всего выделили около ста разных тем. Один запрос может относиться сразу к нескольким темам: так, [как вязать тапки крючком видео] относится и к «рукоделию», и к «одежде». Доля большинства выделенных тем не превышает процента от всех запросов, крупнейшие темы (соцсети, игры, музыка, авто) охватывают 4-6% всего потока.

Сферы жизни — часть классификации, которая говорит о самом пользователе, о том, какое место в его жизни занимает предмет запроса. В любой момент времени человек либо работает, либо отдыхает, либо чему-то учится, либо занимается своими личными делами. Мы разделили все запросы на четыре группы, каждая из которых соответствует одной из этих основных сфер жизни. Как выяснилось, чаще всего люди используют поиск для отдыха или решения личных проблем.

Основные результаты исследования — на картинке.


А подробности читайте в самом исследовании.

.


@темы: ya.ru:author:24856902, ya.ru:text, Поиск, исследования

15:21 

Памяти Алексея Яковлевича Червоненкиса

22 сентября трагически погиб Алексей Яковлевич Червоненкис — ведущий сотрудник Института проблем управления РАН, профессор МФТИ и Лондонского университета, преподаватель Школы анализа данных, человек, который внёс огромный вклад в теорию машинного обучения.

У науки об обучении машин до сих пор было три периода: докомпьютерный, компьютерный и современный период больших данных.

Первой великой работой Червоненкиса и Вапника была вот эта статья, вышедшая в 1971 году. Теория сходимости частот к их вероятностям определила развитие этой части науки на несколько десятков лет вперед.

Это был период «теоретического» развития машинного обучения. Тогда считать можно было только на каких-нибудь М-200 или, в хорошем случае, на БЭСМ-ах, поэтому о «широком применении в народном хозяйстве» речи не шло. Но различать цели в воздухе, например, или выискивать шумы на эхо-кардиограммах это уже помогало.

Потом наступил второй этап науки об обучении машин, компьютерный. В 1990-е люди научились, например, довольно хорошо распознавать и оцифровывать тексты (в том числе рукописные) или очищать почту от спама. Половина из этих методов работала на знаменитом SVM (Support Vector Machine, метод опорных векторов), придуманном в начале 1990-х Червоненкисом и Вапником (VC-Dimension = Vapnik-Chervonenkis dimension). В середине 2000-х в любой известной конторе работали на SVM-е — и у нас, и в Яху, и в Гугле, и в Амазоне, и в Нетфликсе. SVM описан в любом учебнике по нашей теме.

И вот наступила третья эпоха в развитии машинного обучения: появились большие данные и методы работы с ними. Теперь похоже, что всё, что нас окружает, все объекты и сервисы станут немного умнее и научатся нам помогать в каждой мелочи, немного предвидя наши желания. Это примерно как до этого разные механические и химические изобретения немного изменяли нашу жизнь – только теперь в немного новой сфере.

В третью эпоху Червоненкис преподавал в ШАД-е, и в прошлом году на нашей конференции выступил с развитием своей фундаментальной работы 1971 года.

Алексей Яковлевич любил ходить. Он ходил по 20 километров в день — по Москве, по Лондону, по лесу — так он думал. Летом у него была операция, и он не мог ходить три недели. Потом в один день он снова прошел -- километр, потом два, три. И на прошлой неделе он пошел свои 20 километров по знакомой дороге в Лосином Острове.

Аркадий Волож

.


@темы: ya.ru:text, ya.ru:author:24856902

11:51 

Yet another реестр

12 сентября Яндекс внесли в реестр организаторов распространения информации – как и некоторые другие интернет-компании, например, ВКонтакте и Mail.ru. Судя по вопросам, которые мы получаем со всех сторон, это событие беспокоит многих наших пользователей, и все довольно плохо представляют себе, что происходит. Попробуем объяснить, как сейчас это выглядит с нашей точки зрения.

1 августа вступили в силу поправки к закону об информации. Эти поправки получили неофициальное название «закона о блогерах» – именно это название до сих пор многих путает.

Дело в том, что поправки состоят из двух разных блоков. Первый блок вводит такое понятие как «организатор распространения информации» – этот тот, кто обеспечивает работу систем, позволяющих пользователям обмениваться сообщениями. Согласно принятым поправкам, организаторы обязаны в течение шести месяцев хранить – на территории России – всю получаемую информацию о пользователях своих сервисов и совершенных ими действиях. Речь идёт только о факте совершения того или иного действия – иными словами, организаторы должны хранить, например, всю информацию об отправке того или иного письма или загрузке того или иного файла, но не содержание этого письма или файла.

Важно отметить, что закон не обязывает интернет-компании собирать больше информации, чем они и так использовали, чтобы обеспечить нормальную работу своих сервисов. Они обязаны хранить только то, что уже есть, а не разрабатывать какую-то специальную функциональность для сбора и хранения новых данных. Например, если сервис не предусматривает регистрацию и авторизацию пользователей, он не обязан её вводить. Или если у сервиса нет данных о браузере пользователя – ему не надо начинать собирать эту информацию. Ознакомиться с полным списком данных, которые, согласно закону, необходимо хранить – при условии, что они и так есть у сервиса – можно, например, здесь.

Кроме того, первый блок поправок детализирует процесс предоставления данных уполномоченным органам – тем, которые осуществляют оперативно-розыскную деятельность. По определённой процедуре они могут запросить у организатора информацию о любом пользователе и о действиях, которые он совершал.

Вообще говоря, подобные процедуры существовали и раньше. По закону правоохранительные органы вправе запросить у любой организации необходимую им информацию — при наличии законных оснований и при соблюдении законной процедуры. С этой точки зрения, принципиально ничего не поменялось. Также важно, что доступ к содержимому почтового ящика пользователя – то есть его полученным, отправленным письмам – по-прежнему возможен только на основании постановления суда.

Роскомнадзор начал вести реестр организаторов распространения информации. По требованию правоохранительных органов туда вносится название сервиса и контактные данные его владельцев. Это своего рода адресная книга. Само по себе попадание в реестр ничего не меняет – соблюдать закон о хранении данных обязаны все организаторы, вне зависимости от того, оказались они в реестре или нет.

Блогеров касается второй блок поправок. Согласно ему, у блогеров появляются дополнительные обязанности, схожие с обязанностями СМИ. Появление этих обязанностей зависит от посещаемости – если у блогера больше 3000 посещений в сутки, он должен сам обратиться к Роскомнадзору и зарегистрироваться в другом реестре. Юридически реестр организаторов распространения информации и реестр блогеров – совершенно разные вещи, между собой не связанные. Яндекс внесён именно в реестр организаторов распространения информации.

.


@темы: ya.ru:author:24856902, позиция Яндекса, ya.ru:text

12:25 

Новая Музыка

Сегодня мы перезапустили сервис Яндекс.Музыка. Главная задача нового сервиса – открывать для людей музыку. Ту, которую они ещё не слышали, но которая им понравится.


Константин Воронцов, руководитель Яндекс.Музыки
Константин Воронцов, руководитель сервиса Яндекс.Музыка:

В мире очень много музыки. «Очень много» означает, что её куда больше, чем человек может не только послушать, но и вообще осознать.

Давайте попробуем представить. В каталоге Яндекс.Музыки сейчас 17 миллионов треков. Каждый день мы добавляем тысячи новых композиций, в некоторые дни – десятки тысяч. Существуют музыкальные базы данных, которые знают о 30 миллионах треков. Чтобы прослушать такой каталог хотя бы один раз, понадобится больше двухсот лет. Двести лет постоянного звучания музыки.

И вот, приходит живой человек на какой-нибудь музыкальный сервис и задаётся простым, казалось бы, вопросом: «а что бы мне сейчас послушать?» Ответ вроде бы тоже простой: можно предложить слушателю популярную музыку, она же всем нравится, потому и популярная. Нюша, Rihanna, Григорий Лепс, Сплин, Lady Gaga и другие исполнители, чьи лица смотрят на вас с каждой афиши, и чьи песни звучат на каждой второй радиостанции, – действительно лидеры чартов. Только вот в чём подвох: никакого артиста, даже самого популярного, на Яндекс.Музыке не слушает и 10% пользователей. Нас – пользователей сервиса – больше 10 миллионов. И мы все очень разные. Очевидно, и ответ на вопрос «а что бы мне послушать?» у каждого из нас свой.

Последние два года мы занимались тем, что искали ответ на этот вопрос – для каждого свой. Мы научили сервис открывать для наших пользователей новую музыку. Такую, про которую они могут сказать – «Вот! Это то, что надо! В самую точку».

Открытие – важное слово. В мире столько музыки – новой, старой, любой – что неважно, сколько вам лет, сколько дисков у вас дома на полке, сколько треков в телефоне и сколько гигабайт на компьютере. С точки зрения музыкальных ощущений, у всех всё впереди. Всегда можно найти что-то новое для себя. Ведь у музыки, как и у многого другого, есть такая особенность – даже самые любимые, заслушанные до дыр песни нельзя слушать вечно. Время от времени хочется чего-то ещё.

Это могут быть не только новинки. Существует множество почти забытых талантливых музыкантов. У них есть своя аудитория, пусть и не гигантская, и они вполне могли бы понравиться кому-нибудь ещё. Но как им найти дорогу к вашим наушникам?

Да и новинкам приходится непросто. Для многих людей основным источником знаний о новой музыке являются радиостанции. Наверно, не все задумывались, сколько разных треков они крутят. На большинстве популярных звучит 300-500 треков в год, максимум. Бывает и гораздо меньше. Например, на Ибице, мировой столице электронной танцевальной музыки, есть станции, которые крутят 40-50 треков. А ведь для того, чтобы сохранять аудиторию, им нужно иногда ставить в эфир вечные хиты.

Создавая новую Музыку, мы – команда сервиса – постоянно держали в голове это потрясающее разнообразие. Мы считаем, что разнообразие жизненно важно для музыки как для части мировой культуры. И мы не хотим, чтобы она замыкалась на десятке популярных форматов и сотне звёздных артистов. Поэтому мы сделали такой сервис, где вы сможете легко и с удовольствием знакомиться с музыкой, интересной лично вам. Сервис будет советовать вам музыку, основываясь на том, что вам нравится и что слушают ваши друзья. А также – актуальные композиции из окружающего мира: музыку главных фестивалей, фильмов, радиостанций, ту, которую слушают ваши любимые исполнители.

Попробуйте новую Музыку, слушайте, узнавайте, делитесь впечатлениями и идеями. Добро пожаловать в эпоху великих музыкальных открытий!

.


@темы: Музыка, ya.ru:text, ya.ru:author:24856902

12:01 

Все новости дня и коньки впридачу

Всего несколько десятков лет назад люди узнавали о новостях раз в какое-то время, из газет, по телевизору или по радио – и им хватало. Теперь же, благодаря интернету, мы постоянно следим за событиями и сразу узнаём обо всём. Быть в курсе происходящего помогают Яндекс.Новости — крупнейший в рунете новостной агрегатор, автоматически составляющий картину дня на основе материалов нескольких тысяч изданий.

Каждый день робот Новостей обрабатывает более ста тысяч сообщений и объединяет их в сюжеты с помощью технологии извлечения фактов. Результат этой работы вы можете видеть на главной странице Яндекса и на странице Яндекс.Новостей. А теперь — ещё и в мобильном приложении для iPhone.

На первом экране приложения показаны самые актуальные события дня — те, о которых СМИ пишут больше всего прямо сейчас. Последние новости спорта, культуры или экономики можно узнать в соответствующих рубриках, а если в мире происходит что-то особенно важное — к регулярным рубрикам добавляется ещё одна, посвящённая актуальной теме.

Когда видишь любопытную новость или статью, не всегда есть возможность остановиться и вдумчиво её прочесть. А если упустить время, материал «уползёт» вниз ленты, и его потом сложно будет найти. Чтобы этого избежать, мы предусмотрели возможность откладывать новости в «библиотеку». Сохранить и прочитать позже — например, в дороге — можно и отдельные заметки, и сразу несколько новостей.

Чтобы сохранить что-то интересное, его нужно сначала найти, а сделать это в новостном потоке не так уж просто. Решить эту задачу помогает раздел «Мои новости», в котором вы можете собрать сообщения избранных СМИ и новости на интересные вам темы. Чтобы добавить тему, достаточно набрать в поиске ключевое слово, например, «астрофизика» или «iPhone», и сохранить этот запрос в «Моих новостях».

Кроме того, в ленту «Моих новостей» можно добавить публикации ваших друзей в социальных сетях: Твиттере, Фейсбуке, ВКонтакте и Живом Журнале. Эти публикации будут отображаться вместе с сообщениями СМИ. Так что вы увидите в ленте и выбранные вами новости, и материалы, которыми поделились ваши друзья — интересные им заметки или ссылки. К ссылкам, которые они опубликуют, автоматически подтянутся соответствующие сюжеты в Яндекс.Новостях.

«Мои новости» полностью синхронизируются с веб-версией Яндекс.Новостей. Если вы уже составили ленту на сервисе, она автоматически появится и в приложении, как только вы авторизуетесь.

Скачать приложение Яндекс.Новости для iPhone можно здесь. В дальнейшем мы планируем выпустить версию и для платформы Android.

.


@темы: мобильные приложения, Новости, ya.ru:text, ya.ru:author:24856902, iOS

13:59 

Сегодня Илюшин день рожденья

11:05 

Стипендия имени Ильи Сегаловича

Яндекс учредил стипендию имени Ильи Сегаловича – для студентов и аспирантов факультета компьютерных наук в ВШЭ. Стипендия создана для того, чтобы поддержать и поощрить людей, интересующихся наукой и технологиями. Выдаваться она будет за успехи в учёбе и научной деятельности.

Первых стипендиатов определят в первый день рождения факультета – 1 апреля 2015 года. Решение о назначении стипендии будет принимать конкурсная комиссия из преподавателей факультета, среди которых – ведущие разработчики Яндекса.

Всего на выплату стипендий в течение года предусмотрено 3 миллиона 420 тысяч рублей. Эти деньги будут распределены между десятью студентами-бакалаврами, тремя студентами магистратуры и тремя аспирантами. В течение года с момента присуждения стипендии они будут получать соответственно по 10, 20 и 25 тысяч рублей каждый месяц. В будущем, когда факультет вырастет, стипендий тоже может стать больше.

Сейчас на факультете компьютерных наук ВШЭ и Яндекса учится 204 олимпиадника. Сначала планировалось 180 бюджетных мест, но из-за огромного конкурса количество мест увеличили.

1 сентября на факультете ВШЭ и Яндекса

.


@темы: ya.ru:text, ya.ru:author:24856902, наука и образование

13:59 

Объясни это компьютеру

Поисковым системам известны десятки миллиардов веб-страниц. Эти страницы содержат самые разные данные: тексты, картинки, видеоролики, карты, ссылки на другие страницы. Когда вам нужно что-то отыскать в Сети, вы обращаетесь к поисковой системе, и она находит веб-страницы с нужной информацией, ориентируясь на ключевые слова из запроса.

Поисковики достаточно умны, чтобы понимать, на каком языке задан запрос; они умеют учитывать морфологию языка и подбирать словам из запроса синонимы. Однако в полной мере осознать, о чём именно идет речь на найденной веб-странице, машины не в состоянии.


Представьте, к примеру, сайт поликлиники с возможностью записи на приём к врачу через интернет. Среди всех страниц сайта поисковый робот без труда найдёт нужную — ту, где выполняется запись, — но дальше возникнут трудности. Человек легко догадается, что «Иванов», «Петров» и «Сидоров» — это фамилии врачей, «окулист», «невролог» и «терапевт» — их специализации, а «9:00», «9:30» и «10:00» — возможное время начала приёма. Компьютер же самостоятельно такие выводы сделать не может.

А если бы машина могла «читать» страницы так же, как это делает человек, она бы могла помочь в решении гораздо более сложных задач. Скажем, не просто «Записаться к врачу в поликлинику №2», а «Записаться к окулисту, о котором хорошо отзываются, в поликлинику не дальше чем в пяти километрах от моей работы, на 12-13 сентября, на утро, но не позже 11:00».

Впрочем, объяснить компьютеру, о чем идёт речь на веб-странице, вполне возможно. Для этого нужно дать ему подсказку.Такой подсказкой служит семантическая разметка или микроразметка. По сути, микроразметка — это отдельный язык с собственными словарём и синтаксисом, задача которого — помочь машинам (в частности, поисковым роботам) понять концепции, используемые людьми.

Микроразметка добавляется в HTML-код веб-страницы. В глазах человека размеченная и неразмеченная страницы выглядят абсолютно одинаково, но для поисковой системы разница очень велика.

Чтобы понять, как работает микроразметка, рассмотрим простую фразу: «У Петра есть сын Иван». Несмотря на простоту человек может сделать из неё множество выводов: Пётр — отец (а также родитель) Ивана, отчество Ивана — Петрович, Пётр и Иван — мужчины и родственники, Пётр старше Ивана. Все эти факты очевидны, поскольку нам их подсказывает жизненный опыт. У машины такого опыта нет, поэтому она может воспринимать фразу только в её текущей формулировке.

Это — та же самая фраза, но с микроразметкой. Теперь компьютер понимает, что Иван и Пётр — это имена людей, между которыми существует родственная связь (Иван — ребёнок, Пётр — родитель), и ему не составит труда отвечать на вопросы вида «Кто родитель Ивана?». Кроме того, если добавить в разметку уникальные идентификаторы (например, ссылки на страницы в соцсетях), машина сможет отличать конкретных Ивана и Петра от их тёзок.

Микроразметка используется не только в случаях, когда речь идёт о людях. Аналогичным образом можно разметить и музыку, и видеозаписи, и события, и товары, и многое другое.

Единого стандарта микроразметки пока нет. Существуют разные синтаксисы и разные словари. Например, социальные сети собирают данные о сайтах с помощью словаря Open Graph, разработанного в Facebook, а поисковики, включая Яндекс, чаще ориентируются на словарь Schema.org. Подробнее о том, как устроены словари и синтаксисы, можно прочитать в техноблоге Яндекса на «Хабрахабре».

В том или ином виде микроразметку используют около 30% веб-страниц, известных Яндексу. Отсутствие микроразметки не влияет ни на способность страницы попадать в результаты поиска, ни на её позицию в результатах поисковой выдачи. Однако в ряде случаев разметка способна значительно упростить жизнь — как сайтам, так и пользователям.

Сделать наглядный сниппет

Одно из главных достоинств микроразметки состоит в том, что она даёт поисковику возможность строить красивые «сниппеты» — короткие описания сайтов. Например, вы играете на гитаре и ищете в Яндексе [аккорды группа крови]. Если вебмастер сайта, публикующего аккорды, добавил к себе на ресурс семантическую разметку, то вы сможете просмотреть текст песни с аккордами прямо на странице с результатами поиска.

Узнать подробности

Партнёры Яндекс.Видео используют семантическую разметку для того, чтобы сообщить сервису подробности о своих видеозаписях: например, кто играет в том или ином фильме, когда он был снят, каков его жанр и для какой аудитории он предназначен. С помощью этой информации сервис может точней отвечать на запросы пользователей, которые ищут, например [кино с Джеки Чаном], [мультики для самых маленьких] или [комедии шестидесятых].
Аналогичным способом пополняются базы и некоторых других сервисов Яндекса – например, Справочника.

Дать возможность действовать

В новом интерфейсе Яндекса — Островах — у сайтов в поисковой выдаче появятся дополнительные интерактивные блоки. Такой блок позволит пользователю решить задачу, сформулированную в запросе: например, «выбрать автомобиль» или «пожаловаться на погнутые перила в подъезде». Подробнее об островах можно узнать здесь.

Некоторые блоки-«острова» показывают информацию, обновляющуюся в режиме реального времени. Например, в случае с интернет-магазинами вы можете выбрать параметры и увидеть список товаров, которые этим параметрам соответствуют, — и всё это прямо на странице с результатами поиска. Данные для построения такого «острова» сайты передают Яндексу с помощью семантической разметки.

Построить Веб 3.0

В 2001 году Тим Бернерс-Ли, автор концепции Всемирной паутины, предложил идею «семантического веба». Это своего рода надстройка над «обычным» вебом, цель которой — с помощью семантической разметки объяснить машинам, о чём идёт речь на любой странице в интернете. Обладая таким знанием, машины смогут решать куда более сложные задачи, чем сейчас, и лучше понимать людей. Правда, удастся ли воплотить эту идею в жизнь, пока никто не знает.

.


@темы: ya.ru:author:24856902, ya.ru:text, решение задач, Поиск

13:20 

Здравствуйте, школы!

Наступила осень — отдохнувшие за лето школьники и студенты с новыми силами принялись поглощать знания. Мы в Яндексе тоже времени зря не теряли и подготовили несколько образовательных программ для всех, кто интересуется информационными технологиями. Курсов много, так что есть из чего выбрать.

В Москве

Малый ШАД
Бесплатный лекторий, занятия в котором ведут преподаватели вузов, учёные и специалисты разных IT-компаний. Лекции посвящены информатике, математике, лингвистике и смежным областям знаний.
Для кого: для старшеклассников, интересующихся информационными технологиями.
Как поступить: никаких вступительных испытаний, нужно только вовремя зарегистрироваться.
Когда: начало занятий — 13 сентября.
Период обучения: до конца апреля 2015 года, занятия — каждую субботу.

Курсы информационных технологий
Вечерние занятия по системному администрированию, управлению базами данных, сетевым технологиям и информационной безопасности.
Для кого: для студентов и молодых специалистов.
Как поступить: заполнить анкету и выполнить тестовые задания.
Когда: приём тестовых заданий заканчивается 29 сентября.
Период обучения: с 13 октября по 27 ноября, занятия — два-три раза в неделю.

Екатерина Войденко, руководитель группы эксплуатации спецпроектов Яндекса:

«На КИТе вкладываются в каждого человека, да и люди туда приходят сами, они настроены учиться и получать новые знания. Преподаватели чувствуют отдачу от студентов, студенты чувствуют отдачу от преподавателей, люди обмениваются знаниями, что-то обсуждают, делают задания и делятся разными методами решения. К тому же, ты общаешься с живыми людьми в Яндексе, понимаешь, что они такие же, как ты. Исчезает этот комплекс «там умные дядьки сидят, куда мне до них», если он есть. После КИТа я пришла в Яндекс на позицию младшего системного администратора внутренних сервисов, теперь руковожу эксплуатацией спецпроектов и занимаюсь медийными сервисами. Так что, будущим студентам совет: иногда стоит просто попробовать, чтобы узнать на что ты способен лично».



В Санкт-Петербурге

Школа автоматизации процессов разработки
Вечерние курсы по автоматизации процессов разработки и тестирования ПО. Обучение состоит из лекций от сотрудников Яндекса и командной работы над проектами.
Для кого: для студентов старших курсов и выпускников технических специальностей.
Как поступить: заполнить анкету на сайте, решить тестовое задание и пройти собеседование.
Когда: приём анкет прекращается 30 сентября.
Период обучения: С 16 октября, программа рассчитана на два месяца.

В Екатеринбурге

Школа программирования
Очно-заочные курсы, которые включают в себя практические занятия с разработчиками Яндекса и изучение алгоритмов, структур данных, языков программирования Python и C++, а также основ реляционных и нереляционных баз данных. Со второго семестра начинается командная работа над проектами.
Для кого: для студентов старших курсов, магистров и недавних выпускников инженерных и математических специальностей.
Как поступить: заполнить анкету на сайте, выполнить тестовое задание и пройти собеседование.
Когда: приём тестовых заданий прекращается 15 сентября.
Период обучения: один год (два семестра).

Школа разработки интерфейсов
Очно-заочные курсы по фронтенд-разработке. Обучение состоит из цикла лекций и командной работы над проектом.
Для кого: для студентов старших курсов и недавних выпускников.
Как поступить: заполнить анкету и выполнить тестовое задание.
Когда: приём тестовых заданий прекращается 20 октября.
Период обучения: первое занятие — 9 ноября, программа рассчитана на два месяца.

Роман Парадеев, разработчик интерфейсов Яндекс.Маркета:

«О ШРИ я узнал из публикации на Хабрахабре или it-eburg, не помню точно. А поступать решил, когда увидел вступительную задачу. В целом, курс оказался достаточно базовым, самой полезной была возможность побеседовать с интересными людьми. Тогда же во время учёбы устроился в Яндекс. Будущим студентам я хочу сказать: никто за вас учиться не будет, даже в Яндексе».



В Минске

Школа разработки интерфейсов
Курс по фронтенд-разработке. Включает в себя лекции и командную работа над проектами.
Для кого: для студентов и начинающих специалистов.
Как поступить: заполнить анкету и выполнить тестовое задание.
Когда: приём тестовых заданий прекращается 28 сентября.
Период обучения: первое занятие — 15 октября, программа рассчитана на два месяца.

Особенность информационных технологий состоит в том, что некоторые вещи, ещё вчера казавшиеся актуальными, уже сегодня могут оказаться безнадёжно устаревшими. Образовательные программы Яндекса дают возможность получить знания из первых рук от тех, кто создаёт передовые технологии. А для лучших студентов это ещё и шанс стать частью Яндекса.

.


@темы: ya.ru:author:24856902, ya.ru:text, наука и образование

15:12 

Миллион паролей от Яндекса

Вчера на нескольких сайтах появилась информация про базу логинов и паролей на Яндексе – более миллиона записей. Мы проанализировали эту базу и совершенно уверены, что она получена не в результате взлома наших сервисов.

Вам не нужно искать этот список логинов и паролей и проверять, нет ли там вас.
Всех пользователей, которые туда попали, мы уже оповестили и сбросили их пароли – теперь в эти ящики невозможно войти, не поменяв пароль. Просто попробуйте войти в вашу Яндекс.Почту. Если вам не предлагают поменять пароль – значит можно не беспокоиться.



Наши специалисты уверены, что база собиралась в течение долгого времени, а не в результате целенаправленной атаки. Злоумышленники получают доступ к учётным данным пользователей разными способами – с помощью фишинга (когда пользователи вводят свои данные на сайте-подделке), вирусов или кросс-чека (когда люди используют одинаковые пароли на разных ресурсах, взлом одного из них означает, что скомпрометированы все).

Среди паролей в списке есть такие, которые мы уже давно не разрешаем использовать при создании новой учётной записи (например, «qwerty»). О 85% аккаунтов из выложенной базы нам было известно и до этого – большинство из них появляются в подобных списках уже несколько лет. Для некоторых аккаунтов пароли уже были сброшены – но их владельцы так и не поменяли пароль и не зашли в свой почтовый ящик. Это означает, что эти ящики либо давно заброшены, либо созданы роботами.

Подробности о том, как мы храним пароли и почему считаем, что дело не во взломе сервиса, можно прочитать в нашем блоге на Хабре. Ну и на всякий случай: время от времени полезно менять пароль, даже без всяких причин.

.


@темы: безопасность, ya.ru:text, ya.ru:author:24856902

13:47 

Китайская грамота

На сервисе Яндекс.Перевод появились китайский и тайский языки. Теперь вы можете перевести описание товара в китайском интернет-магазине на русский или изучить историю достопримечательностей Таиланда на местных сайтах, если собираетесь в путешествие и решили вооружиться информацией до зубов. В мобильном приложении Яндекс.Перевод для iOS китайский и тайский языки уже доступны, скоро появятся и в приложении для Android.







Команда Яндекс.Перевода регулярно получает от пользователей просьбы о добавлении новых языков, и китайский был одним из тех, о которых просили больше всего. На Яндекс.Переводе уже есть азиатские языки – в апреле появились вьетнамский, индонезийский и малайский. Дальше корпус азиатских языков будет ещё пополняться.



Всего Яндекс.Перевод знает уже 44 языка, и у каждого свои «трудности перевода», которые приходится учитывать разработчикам сервиса. В китайском, например, нет пробелов, и сочетание иероглифов


@темы: Перевод, ya.ru:text, ya.ru:author:24856902

13:18 

Стереотипы начинают и выигрывают

Пять дней в неделю утром на работу, в обед бизнес-ланч, вечером в пятницу за продуктами, а потом иногда в бар, в субботу — кино, торговый центр или салон красоты, ну а после, может быть, ночной клуб. И в понедельник вечером — в спортзал, чтобы восстановить силы. И так изо дня в день. По крайней мере такая была гипотеза у нашего аналитика геоинформационных сервисов. Чтобы проверить её, он посмотрел, как запросы пользователей мобильных Яндекс.Карт и Навигатора распределяются по дням недели.

И, да, всё так и вышло.

Продуктами закупаются в пятницу и выходные:


Цветы ищут вечером, особенно по пятницам и субботам:


А вот банки нужны всё время:

С понедельника новая жизнь, а вот в пятницу вечером на фитнес ходят мало:


Потому что в пятницу вечером старую жизнь провожают в барах и пабах:


В ресторанах и кафе в будни чётко видны обед и ужин, а вот в выходные бизнес-ланчи не подают:


В выходные других дел хватает. Заехать в автосервис:


Сходить в кино:


Или в салон красоты, чтобы подготовиться к началу новой недели:


По данным мобильных Яндекс.Карт и Навигатора, март-июль 2014 (без учёта праздничных дней)

.


@темы: исследования, ya.ru:text, ya.ru:author:24856902

12:43 

Как устроены переводные словари Яндекса

Что важнее всего при изучении иностранного языка? Желание, свободное время, проверенный учебник, хороший преподаватель? Безусловно. А ещё — хороший словарь.

У многих из нас на полках стоят бумажные словари: старые и новые, общие и специализированные, многотомные и карманные. С ними, как и с любыми книгами, может быть связано множество воспоминаний: например, о школьных уроках немецкого или о первой поездке за рубеж. Но вряд ли кто-то поспорит с тем, что по удобству использования бумажные словари проигрывают электронным.

Работать с электронными словарями проще и быстрее, чем с бумажными: не нужно перелистывать страницы в поисках слова, можно не только прочитать перевод слова, но и услышать, как оно звучит, а пользоваться словарём можно на любом устройстве. На сервисе Яндекс.Словари представлены три вида электронных словарей: переводные, энциклопедические и словари русского языка: толковые, этимологические, орфографические, фразеологические, словари синонимов и так далее.

Если ввести в поисковую строку Словарей, например, слово [колибри], то словари русского языка дадут его краткое толкование, расскажут, откуда произошло слово, есть ли у него синонимы и на какой слог в нём ставить ударение. Из энциклопедических словарей можно узнать, как выглядит колибри, где обитает и чем питается. Переводные словари, об устройстве которых мы хотим рассказать, подскажут, как слово переводится на иностранные языки.


Сколько у нас словарей

Сейчас в коллекции сервиса Яндекс.Словари — 67 переводных словарей для десяти языков, включая казахский, турецкий и латынь. В нашем индексе есть как общие, так и специализированные словари: для юристов, биологов, врачей, авиаторов. Мы используем готовые электронные словари, а не составляем их самостоятельно: эта работа требует специальных навыков и знаний, и её выполняют ученые-лексикографы.

Как формируется словарная статья

Мы не знаем, какая именно задача стоит перед пользователем, заглянувшим в словарь. Возможно, он делает школьное задание по английскому языку, а может быть, переводит статью про плазмохимическое травление в микроэлектронике. Поэтому для каждого слова мы показываем все переводы из всех словарей, где оно нашлось. Само по себе это несложно, но без специальной обработки результатов пользователям придётся продираться через большое количество повторов. Перевод будет выглядеть примерно так:


Чтобы не дублировать информацию, мы научились разбирать словарные статьи на отдельные переводы и склеивать переводы по близости значений. Этим в переводных Яндекс.Словарях занимается специальный алгоритм.

Алгоритм извлекает из словарных статей данные — основные и вспомогательные. Основные — это заголовок и список переводов; иными словами, то, что составляет структуру статьи. К вспомогательным данным относятся часть речи, грамматические пометки, транскрипция, примеры употребления и тематика.

Дальше алгоритм, ориентируясь на основные (а при необходимости — и на вспомогательные) данные, распределяет переводы по частям речи, собирает близкие по значению переводы в одну строку и удаляет дубликаты. В результате получается такая статья:

Многие статьи проиллюстрированы примерами. Примеры мы тоже получаем из словарей, входящих в индекс. В словарях примеры часто даются списком в конце статьи, что не всегда удобно. Наш же алгоритм умеет распределять примеры по значениям – вот так:

По большому счету, переводные Яндекс.Словари – это один большой «мегасловарь», собранный по данным из разных источников. Лишняя информация (переводы-повторы) из него удалена, а нужная (примеры или синонимы) добавлена. Такой «мегасловарь» универсален: им могут пользоваться и профессиональные переводчики, и те, кто только-только приступил к изучению иностранного языка.

Помимо Словарей, у Яндекса есть еще один сервис для тех, кто имеет дело с иностранным языком, – это Перевод. Если Словари предназначены главным образом для тех, кто серьезно изучает язык, то автоматический переводчик может пригодиться, например, в зарубежной поездке или в случае, когда нужно примерно понять содержание текста на незнакомом языке.

.


@темы: как это работает?, Словари, ya.ru:text, ya.ru:author:24856902

11:31 

Время менять пароли

7 апреля стало известно об уязвимости в пакете шифрования данных OpenSSL. (О том, что такое шифрование данных и зачем оно нужно, мы рассказывали некоторое время назад.) Эта уязвимость стала настолько известной, что у нее даже есть имя - Heartbleed. Так важна она потому, что пакет OpenSSL используют две трети интернет-ресурсов, и среди них – практически все популярные сервисы. И Яндекс, и Google, и Facebook, и еще очень многие. Суть уязвимости – в том, что злоумышленники могли получить до 64 килобайт случайных данных в незашифрованном виде. При наличии времени и терпения они могли повторять запросы, пока среди полученной информации не окажутся, например, логины и пароли пользователей.

Мы начали устанавливать обновления безопасности на сервисах Яндекса сразу после сообщения о Heartbleed. Некоторые из наших сервисов – например, и это важно, Яндекс.Деньги – проблема вообще не затронула, остальные перестали быть подвержены уязвимости уже через несколько часов. Эти несколько часов были самыми опасными – о проблеме уже могли знать злоумышленники, а интернет-компании еще не успели ее устранить. Поэтому мы тщательно проверили статистику наших сервисов – никаких массовых обращений к нашим серверам, которые могли бы свидетельствовать об атаке, не было.

Тем не менее мы очень рекомендуем нашим пользователям поменять свои пароли. Это касается не только паролей от Яндекса, а вообще от всех сервисов, которыми вы пользуетесь. (И которые успели устранить уязвимость, проверить это можно здесь). Heartbleed еще раз показала, что ни один сервис в интернете не может быть абсолютно безопасным. Но защитить себя не так сложно – достаточно почаще менять пароли. А чтобы еще немного упростить эту задачу, мы сделали специальную страницу-помощника. Кроме того, напоминаем наши советы – как придумать хороший пароль и как сохранить его.

.


@темы: безопасность, ya.ru:text, ya.ru:author:24856902

Блог Яндекса

главная