Вот очень, очень длинный список того, что вы порекомендовали из научной фантастики за этот и прошлый цикл (который первый).
Руками мы это перебирать не стали, зато убили несколько миллионов токенов у боубэ.
Что сделали:
— Спарсили 5 дней в первом случае и 3 дня во втором комментариев из чата, потому что часть книг обсуждалась в комментариях к постам, часть только в чате (все комментарии к постам попадают в чат, но не все сообщения чата являются комментариями к постам). Вот начиная с этого места в чате парсинг кончился, там ниже не учлись советы, но можно пойти и посмотреть.
— Скормили в LLM нормализовать всё это, считать лайки, дубли комментариев и т.п.
— Взвесили лайки и ответы (не все лайки одинаково полезны).
— Модель прошлась по каждому пункту, проверила написание авторов и книг, правильность указания наиболее популярного названия в переводе на русский.
— Там, где описание было в духе «интрига бешеная» модель расковыряла, почему книгу рекомендуют. Где это можно было вычислить из соседних комментариев, приоритет получили они, где не было ничего вообще — что-то придумала из common crawl.
— Вычли книги первого списка.
— Причесали и добавили к первой серии советов.
Так что теперь после первой серии ещё и вторая, где ВООБЩЕ ПОЧТИ ВСЁ.
--
Вступайте в ряды Фурье!
— Что читаешь?
— Матанализ!
— А чего книга вверх ногами?
— А какая разница?
custom: 22
🔥: 249
❤: 72
👍: 41
🤣: 14
❤🔥: 7
⚡: 4