Разбирая данные →
Системы рекоммендаций: советы от машины
Системы рекомендаций:
— Советы от машины
— Холодное начало
— Введение в гибридные системы
— искусственные имунные системы и эффект идиотипов
Многие современные тенденции веб дизайна направлены на то, чтобы помочь пользователю лучше ориентироваться и по возможности облегчить выбор и принятие решений. Есть множество явных и неявных способов способов направлять и манипулировать поведением пользователя, фокусировать его внимание на нужных аспектах системы и влиять на принимаемые им решения. Но возможно ли, а главное, нужно ли избавить пользователя от необходимости выбора? Можно ли доверить часть решений автоматизированным системам рекомендаций?
Хорошее и лаконичное определение системе рекомендаций дает Википедия:
Системы рекомендаций — это особенный вид техники фильтрации информации стремящийся представлять информацию (фильмы, музыку, книги, изображения, веб сайты и тп), которая скорее всего заинтересует пользователя. Обычно система рекомендаций сравнивает профиль пользователя с какой-то справочной информацией и старается предсказать «рейтинг», который пользователь даст объекту, над которым он еще даже не думал.
Системы рекомендаций (далее — СР), можно классифицировать по-разному:
По способу сбора информации их можно поделить на явные и неявные (Implicit data collection). Явные способы, включают в себя, например, голосование, сортировка объектов по тому, на сколько они нравятся или не нравятся и непосредственное составление списка того, что пользователь любит. Неявные способы заключается в анализе активности пользователя и попытке выявить какие-то зависимости.
По методу обработки информации СР можно выделить один из самых распространенных подходов: совместную фильтрацию (Collaborative filtering). Эти системы анализируют поведение пользователя и строят рекомендации на основе мнения похожих на него людей: ведь те, кто соглашались в прошлом, скорее всего, будут соглашаться и в будущем. Этот метод требует огромного количество исходных данных, но есть и альтернативные способы предсказать мнение пользователя не зависимо от коллективного разума, используя различные математические алгоритмы.
Я не большой любитель классификаций, по-этому воздержусь от дальнейшего углубления в эту тему. Классификацию всегда можно пополнить по мере необходимости.
Сфера применения СР очень широкая, в том числе, и в интернете. Вот несколько известных примеров использования таких систем:
Даже всем известное облако тегов, по сути, тоже является рекомендацией. Размер тега показывает, о чем читают другие и о чем стоит почитать самому пользователю.
Если читателям интересна эта тема, я постараюсь продолжить писать о ней, ведь применение и реализация таких систем действительно интересны, говорю по собственному опыту. А пока советую задуматься над следующими вопросами:
— Можете ли вы положиться на подобную систему?
— Важно ли вам знать о принципах работы и устройстве системы, или достаточно видеть только результат?
— На сколько вы можете доверять подобным системам? На сколько вы готовы впустить их в свою личную жизнь? Как вы выбираете грань между функциональными возможностями и этическими нормами?
Ответить на эти вопросы можно вслух в комментариях.
Оригинал на моем блоге
— Советы от машины
— Холодное начало
— Введение в гибридные системы
— искусственные имунные системы и эффект идиотипов
Многие современные тенденции веб дизайна направлены на то, чтобы помочь пользователю лучше ориентироваться и по возможности облегчить выбор и принятие решений. Есть множество явных и неявных способов способов направлять и манипулировать поведением пользователя, фокусировать его внимание на нужных аспектах системы и влиять на принимаемые им решения. Но возможно ли, а главное, нужно ли избавить пользователя от необходимости выбора? Можно ли доверить часть решений автоматизированным системам рекомендаций?
Краткое введение
Хорошее и лаконичное определение системе рекомендаций дает Википедия:
Системы рекомендаций — это особенный вид техники фильтрации информации стремящийся представлять информацию (фильмы, музыку, книги, изображения, веб сайты и тп), которая скорее всего заинтересует пользователя. Обычно система рекомендаций сравнивает профиль пользователя с какой-то справочной информацией и старается предсказать «рейтинг», который пользователь даст объекту, над которым он еще даже не думал.
Системы рекомендаций (далее — СР), можно классифицировать по-разному:
По способу сбора информации их можно поделить на явные и неявные (Implicit data collection). Явные способы, включают в себя, например, голосование, сортировка объектов по тому, на сколько они нравятся или не нравятся и непосредственное составление списка того, что пользователь любит. Неявные способы заключается в анализе активности пользователя и попытке выявить какие-то зависимости.
По методу обработки информации СР можно выделить один из самых распространенных подходов: совместную фильтрацию (Collaborative filtering). Эти системы анализируют поведение пользователя и строят рекомендации на основе мнения похожих на него людей: ведь те, кто соглашались в прошлом, скорее всего, будут соглашаться и в будущем. Этот метод требует огромного количество исходных данных, но есть и альтернативные способы предсказать мнение пользователя не зависимо от коллективного разума, используя различные математические алгоритмы.
Я не большой любитель классификаций, по-этому воздержусь от дальнейшего углубления в эту тему. Классификацию всегда можно пополнить по мере необходимости.
Применение
Сфера применения СР очень широкая, в том числе, и в интернете. Вот несколько известных примеров использования таких систем:
- На amazon.com и многих других интернет магазинах при выборе товара можно увидеть список товаров, которые покупали пользователи, которые ранее купили выбранный вами товар. С его помощью, покупатель может быстро найти товар, похожий на тот, что ему приглянулся. Такая система хорошо работает с дополняющими друг-друга товарами, но она вряд ли сможет предложить пользователю альтернативный выбор.
- Last.fm — музыкальный сайт, который использует программу Audioscrobbler. Один из моих любимых примеров. Все, что требуется от пользователя — это установить программу на свой компьютер, и она будет автоматически анализировать музыку, которую слушает пользователи, и давать ему советы. Именно из-за слова «автоматически» я ее и люблю: она может работать в фоновом режиме и пользователю не надо делать никаких лишних действий.
- Некоторые информационные ресурсы, такие как digg.com (Digg Recommendation Engine) и сам Хабрахабр (Хабралента 3.0) используют СР для определения того, какие статьи и новости могут быть интересны конкретному пользователю. Эта сфера мне, лично, особенно интересна потому, что я в данный момент сам работаю над таким проектом. Такие системы анализируют множество косвенных и явных проявлений интереса пользователя, такие как просмотр новостей, голосование и занесение в «избранное». Важно, чтобы такие системы использовали не только явные проявление интереса, особенно, если они ограничены, как голосование на Хабрахабре, но и все возможные неявные факторы.
Даже всем известное облако тегов, по сути, тоже является рекомендацией. Размер тега показывает, о чем читают другие и о чем стоит почитать самому пользователю.
К чему все это?
Если читателям интересна эта тема, я постараюсь продолжить писать о ней, ведь применение и реализация таких систем действительно интересны, говорю по собственному опыту. А пока советую задуматься над следующими вопросами:
— Можете ли вы положиться на подобную систему?
— Важно ли вам знать о принципах работы и устройстве системы, или достаточно видеть только результат?
— На сколько вы можете доверять подобным системам? На сколько вы готовы впустить их в свою личную жизнь? Как вы выбираете грань между функциональными возможностями и этическими нормами?
Ответить на эти вопросы можно вслух в комментариях.
Оригинал на моем блоге
20.04.2009 22:33+0400