Уважаемые студенты! Координационный центр по вопросам противодействия идеологии терроризма и экстремизма при ПГНИУ приглашает Вас принять участие в хакатоне!
Партнерами мероприятия выступают фонд «Цифровая долина Прикамья» и компания-разработчик специализированного программного обеспечения для нужд государственного сектора ООО «Сеуслаб».
Для участия в хакатоне требуется команда (от 2 до 5 человек). Подача заявки для регистрации команды осуществляется по ссылке: https://forms.gle/zyg76AFdjr2kmcB99
Участники мероприятия получат сертификаты, победители и призеры будут поощрены грамотами и ценными призами!
1. Программа хакатона
Дата | Ответственный | |
Формирование команд | 02-07 ноября | ПГНИУ |
Выдача кейса участникам хакатона | 7 ноября | ООО «СЕУСЛАБ» |
Консультация/разбор кейсов с участниками хакатона (при необходимости) | 10 ноября 20:00 по Пермскому времени – Яндекс Телемост. * | ООО «СЕУСЛАБ» |
Решение задачи участниками хакатона | С 7 ноября по 12 ноября | ПГНИУ |
Очная презентация/демонстрация результатов решения кейсов участниками хакатона. Место проведения будет доведено до участников команд в ходе мероприятия. Подведение итогов хакатона, определение победителей | 13 ноября с 16 до 18 по Пермскому времени. | ПГНИУ/ ООО «СЕУСЛАБ» |
2. Требования к участникам хакатона (компетенции)
Для успешного решения кейсов, предложенных для хакатона, участники должны обладать следующими компетенциями:
- Владение актуальными языками программирования;
- Знания и опыт в области больших языковых моделей (существующие модели и экосистемы, принципы применения, принципы развертывания локальных языковых моделей и требования к ним).
- Знания и опыт в области поиска, подбора, апробации готовых AI решений для решения различных задач. Опыт работы с AI-хабами (huggingface и другие);
- Знания и опыт в области информационного поиска, в том числе, AI технологиях, применяемых для информационного поиска.
3. Приемка результатов решений кейсов хакатона
- Приемка и определение лучших решений будет произведена организаторами очно – в день проведения хакатона;
- Каждой команде необходимо подготовить 20 минутную презентацию выбранного к решению кейса, в ходе которой демонстрируется практическая работоспособность разработанного программного продукта.
- Каждой команде необходимо предоставить организаторам все исходные данные и код решения.
4. Кейсы для хакатона
Дообучение большой языковой модели на неструктурированных данных предоставленных организаторами.
Сегодня на рынке представлено множество больших языковых моделей, пригодных для дообучения с целью решения различных задач на пользовательских данных – как структурированных, так и не структурированных.
Требуется разработать систему (компьютерную программу), которая будет решать задачи поиска информации с применением неструктурированных данных, предоставленных организаторами.
В ходе решения кейса необходимо
- Выбрать языковую модель, которую можно дообучить имеющимися средствами и изучить процесс дообучения модели;
- Дообучить модель на массиве данных, предоставленных организаторами;
- Реализовать интерфейс взаимодействия пользователя с моделью – в виде чата.
Описание принципа работы системы
Пользователь задает поисковые запросы по данным, на которых дообучалась модель на естественном языке (русский) — система выдает развернутые ответы на вопросы пользователя, иллюстрируя их данными, на которых она дообучалась.
Ожидаемые результаты
В ответе модели пользователь должен получить фактическую информацию, содержащуюся в данных на которых дообучалась модель;
Пользователь должен иметь возможность уточнять, изменять, задавать новые вопросы к модели – при этом ответ на отредактированный/новый вопрос должен выдаваться с учетом контекста.
Предоставляемые данные
Массив неструктурированных данных (тексты), на котором необходимо дообучить модель предоставляется организаторами.
Дополнительная информация
https://brev.dev/blog/fine-tuning-llama-2-your-own-data
https://www.mlexpert.io/machine-learning/tutorials/alpaca-fine-tuning
Обучение большой языковой модели генерации ответов, построенных на структурированных данных, предоставленных организаторами.
Сегодня в корпоративных хранилищах каждой организации размещено множество наборов структурированных данных (таблицы, базы данных). Требуется разработать систему (компьютерную программу), которая будет решать задачи получения пользователем информации, на основе запросов к структурированным данным, предоставленных организаторами.
В ходе решения кейса необходимо
- Загрузить полученные массивы структурированных данныхпредоставленных организаторами в СУБД (SQL/NoSQL);
- Выбрать готовую обученную/необученную языковую модель, способную генерировать запросы к выбранной СУБД по запросу на естественном языке или разработать свою;
- При необходимости, подготовить датасет для обучения модели и на основе полученных от организаторов данных обучить модель;
- Реализовать интерфейс взаимодействия модели с СУБД и модели с пользователем.
Описание принципа работы системы
Пользователь задает поисковые запросы к структурированным данным, предоставленным организаторами для кейса, на естественном языке (русский); система выдает развернутые ответы на вопросы пользователя, иллюстрируя их данными.
Ожидаемые результаты
В ответе модели пользователь должен получить фактическую информацию, содержащуюся в данных, на которых дообучалась модель;
Пользователь должен иметь возможность уточнять, изменять, задавать новые вопросы к модели – при этом ответ на отредактированный/новый вопрос должен выдаваться с учетом контекста.
Предоставляемые данные
Массивы структурированных данных на которых необходимо дообучить модель предоставляются организаторами.
https://huggingface.co/defog/sqlcoder
https://huggingface.co/juierror/text-to-sql-with-table-schema
Вся дополнительная информация о мероприятии будет размещаться на интернет ресурсах ПГНИУ.
В ходе проведения хакатона может проводиться фото- и видеосъемка.
Принимая участие в данном мероприятии, участники соглашаются с тем, что их имена и фамилии, иные материалы о них, изображения участников (в том числе фотоматериалы, видеоматериалы) могут быть использованы любым способом организатором, их уполномоченными представителями в целях информирования, без оформления дополнительного соглашения с участниками хакатона и уплаты какого-либо вознаграждения.
Контакты организаторов: arusmanov85@gmail.com, Усманов Антон Рашидович
Координационный центр при ПГНИУ
Расположение: ауд. 204, корп. 3 (2 этаж)
Раб. телефон: +7 (342) 239-68-46
QR-код для регистрации
