🖼 Ученые Яндекса разработали и выложили в открытый доступ Yambda — датасет с 5 милли...
Ученые Яндекса разработали и выложили в открытый доступ Yambda — датасет с 5 миллиардами обезличенных взаимодействий из Яндекс Музыки для улучшения рекомендательных систем. Они развиваются медленнее, чем популярные LLM — для рексистем нужны тонны качественных данных, которых почти нет в открытом доступе. Компании их почти не публикуют, а доступные имеют слишком мало параметров для качественных исследований. Открытие такого огромного датасета — большой шаг для науки и индустрии и поможет спецам тестировать и тренировать свои алгоритмы.@exploitex

Ученые Яндекса разработали и выложили в открытый доступ Yambda — датасет с 5 миллиардами обезличенных взаимодействий из Яндекс Музыки для улучшения рекомендательных систем.
Они развиваются медленнее, чем популярные LLM — для рексистем нужны тонны качественных данных, которых почти нет в открытом доступе. Компании их почти не публикуют, а доступные имеют слишком мало параметров для качественных исследований.
Открытие такого огромного датасета — большой шаг для науки и индустрии и поможет спецам тестировать и тренировать свои алгоритмы.
@exploitex
Какова ваша реакция?






