Это репозиторий для решения кейса от ВК для хакатона с курса ЦК МФТИ "Продвинутые методы машинного обучения"
Команда mipt dudes
В нашем решении присутствуют три модели, иллюстрирующие развитие технологии. Им соответствуют 3 файла:
- baseline.ipynb - базовая версия, основанная на косинусной мере близости
- advancedv_1.ipynb - тестовая версия, основанная на bert, но без дообучения
- final_model.ipynb - финальная версия bert с дообучением
- https://drive.google.com/file/d/1fLTvYb6yMV9B4xCatVB8JEEjssAwXz2K/view?usp=drive_link - финальная модель
- https://drive.google.com/file/d/1_5hBiVeIg3AN6fdQmyQrsJQV2nSuu4Fp/view?usp=sharing - предобработанный датасет