Студентов ПГНИУ приглашают на хакатон

Уважаемые студенты! Координационный центр по вопросам противодействия идеологии терроризма и экстремизма при ПГНИУ приглашает Вас принять участие в хакатоне!

Партнерами мероприятия выступают фонд «Цифровая долина Прикамья» и  компания-разработчик специализированного программного обеспечения для нужд государственного сектора ООО «Сеуслаб».

Для участия в хакатоне требуется команда (от 2 до 5 человек). Подача заявки для регистрации команды осуществляется по ссылке: https://forms.gle/zyg76AFdjr2kmcB99

Участники мероприятия получат сертификаты, победители и призеры будут поощрены грамотами и ценными призами!

1. Программа хакатона

 ДатаОтветственный
Формирование команд02-07 ноябряПГНИУ
Выдача кейса участникам хакатона7 ноябряООО «СЕУСЛАБ»
Консультация/разбор кейсов с участниками хакатона (при необходимости)10 ноября 20:00 по Пермскому времени – Яндекс Телемост. *ООО «СЕУСЛАБ»
Решение задачи участниками хакатонаС 7 ноября по 12 ноябряПГНИУ
Очная презентация/демонстрация результатов решения кейсов участниками хакатона. Место проведения будет доведено до участников команд в ходе мероприятия. Подведение итогов хакатона, определение победителей13 ноября с 16 до 18 по Пермскому времени.ПГНИУ/ ООО «СЕУСЛАБ»  
*Время консультации может быть скорректировано организаторами с учетом пожеланий участников команд.

2. Требования к участникам хакатона (компетенции)

Для успешного решения кейсов, предложенных для хакатона, участники должны обладать следующими компетенциями:

  • Владение актуальными языками программирования;
  • Знания и опыт в области больших языковых моделей (существующие модели и экосистемы, принципы применения, принципы развертывания локальных языковых моделей и требования к ним).
  • Знания и опыт в области поиска, подбора, апробации готовых AI решений для решения различных задач. Опыт работы с AI-хабами (huggingface и другие);
  • Знания и опыт в области информационного поиска, в том числе, AI технологиях, применяемых для информационного поиска.

3. Приемка результатов решений кейсов хакатона

  • Приемка и определение лучших решений будет произведена организаторами очно – в день проведения хакатона;
  • Каждой команде необходимо подготовить 20 минутную презентацию выбранного к решению кейса, в ходе которой демонстрируется практическая работоспособность разработанного программного продукта.
  • Каждой команде необходимо предоставить организаторам все исходные данные и код решения.

4. Кейсы для хакатона

Дообучение большой языковой модели на неструктурированных данных предоставленных организаторами.

Сегодня на рынке представлено множество больших языковых моделей, пригодных для дообучения с целью решения различных задач на пользовательских данных – как структурированных, так и не структурированных.

Требуется разработать систему (компьютерную программу), которая будет решать задачи поиска информации с применением неструктурированных данных, предоставленных организаторами.

В ходе решения кейса необходимо

  • Выбрать языковую модель, которую можно дообучить имеющимися средствами и изучить процесс дообучения модели;
  • Дообучить модель на массиве данных, предоставленных организаторами;
  • Реализовать интерфейс взаимодействия пользователя с моделью – в виде чата.

Описание принципа работы системы

Пользователь задает поисковые запросы по данным, на которых дообучалась модель на естественном языке (русский) — система выдает развернутые ответы на вопросы пользователя, иллюстрируя их данными, на которых она дообучалась.

Ожидаемые результаты

В ответе модели пользователь должен получить фактическую информацию, содержащуюся в данных на которых дообучалась модель;
Пользователь должен иметь возможность уточнять, изменять, задавать новые вопросы к модели – при этом ответ на отредактированный/новый вопрос должен выдаваться с учетом контекста.

Предоставляемые данные

Массив неструктурированных данных (тексты), на котором необходимо дообучить модель предоставляется организаторами.

Дополнительная информация

https://brev.dev/blog/fine-tuning-llama-2-your-own-data
https://www.mlexpert.io/machine-learning/tutorials/alpaca-fine-tuning

Обучение большой языковой модели генерации ответов, построенных на структурированных данных, предоставленных организаторами.

Сегодня в корпоративных хранилищах каждой организации размещено множество наборов структурированных данных (таблицы, базы данных). Требуется разработать систему (компьютерную программу), которая будет решать задачи получения пользователем информации, на основе запросов к структурированным данным, предоставленных организаторами.

В ходе решения кейса необходимо

  • Загрузить полученные массивы структурированных данныхпредоставленных организаторами в СУБД (SQL/NoSQL);
  • Выбрать готовую обученную/необученную языковую модель, способную генерировать запросы к выбранной СУБД по запросу на естественном языке или разработать свою;
  • При необходимости, подготовить датасет для обучения модели и на основе полученных от организаторов данных обучить модель;
  • Реализовать интерфейс взаимодействия модели с СУБД и модели с пользователем.

Описание принципа работы системы

Пользователь задает поисковые запросы к структурированным данным, предоставленным организаторами для кейса, на естественном языке (русский); система выдает развернутые ответы на вопросы пользователя, иллюстрируя их данными.

Ожидаемые результаты

В ответе модели пользователь должен получить фактическую информацию, содержащуюся в данных, на которых дообучалась модель;
Пользователь должен иметь возможность уточнять, изменять, задавать новые вопросы к модели – при этом ответ на отредактированный/новый вопрос должен выдаваться с учетом контекста.

Предоставляемые данные

Массивы структурированных данных на которых необходимо дообучить модель предоставляются организаторами.

https://huggingface.co/defog/sqlcoder

https://huggingface.co/juierror/text-to-sql-with-table-schema

Вся дополнительная информация о мероприятии будет размещаться на интернет ресурсах ПГНИУ.
В ходе проведения хакатона может проводиться фото- и видеосъемка.
Принимая участие в данном мероприятии, участники соглашаются с тем, что их имена и фамилии, иные материалы о них, изображения участников (в том числе фотоматериалы, видеоматериалы) могут быть использованы любым способом организатором, их уполномоченными представителями в целях информирования, без оформления дополнительного соглашения с участниками хакатона и уплаты какого-либо вознаграждения.

Контакты организаторов: arusmanov85@gmail.com, Усманов Антон Рашидович
Координационный центр при ПГНИУ
Расположение: ауд. 204, корп. 3 (2 этаж)
Раб. телефон: +7 (342) 239-68-46

QR-код для регистрации

Прокрутить наверх

Обращение в Студенческий медиацентр

Пожалуйста представься,
укажи контактные данные.
Анонимки мы не рассматриваем.