Алгоритм поиска мошенников

ЗАКАЗЧИК
UNIDAYS
ТЕХНОЛОГИИ
AI разработка
ГОД
2022
СРОК
3 месяца
UNIDAYS

UniDays — это компания, предоставляющая студентам и молодежи доступ к эксклюзивным скидкам и предложениям от различных брендов и магазинов. Они сотрудничают с университетами и колледжами, чтобы предоставить студентам привилегии при покупках и онлайн-покупках. Студенты в России повально использовали UniDays для получения студенческой подписки на Apple музыку

Unidays было необходимо определить, совершает ли аккаунт мошеннические операции, и, если да, предоставить информацию об этом. Сложность была в том, что существовал недостаток размеченных данных и не было формализованных критериев подозрительной активности

Единственные полезные данные, которые мы получили были время выкупа купона и платформа, на которой он был выкуплен. Поэтому мы начали с разработки собственных правил для определения подозрительных действий, сфокусировавшись на признаках автоматизации и нечеловеческого поведения.

При выборе библиотек для нашего проекта мы опирались на знание того, что нам предстоит работать с большими наборами данных, их графическим представлением, нечеткой логикой и машинным обучением.

Для обработки и манипулирования набором данных мы решили использовать библиотеку Pandas, так как мы знакомы с ее использованием, и она способна чистить данные с относительной легкостью и точностью, не потребляя большое количество ресурсов. Для создания графиков и визуализации данных, а также для работы с нечеткой логикой, мы выбрали библиотеку Matplotlib, так как она хорошо сочетается с типами графиков, которые мы будем использовать, и хорошо совместима с нашей библиотекой нечеткой логики SKfuzzy.

Мы выбрали библиотеку SciKit-Fuzzy, так как она является одной из наиболее доступных и широко используемых библиотек для нечеткой логики. Она написана на языке Python, который мы используем в нашем проекте. С помощью SciKit-Fuzzy мы можем создавать сложные графики, отображающие наши нечеткие результаты. Это означает, что у нас есть не только двоичная оценка подозрительности, но и более широкий диапазон подозрительности, что позволяет нам делать более обоснованные предположения о том, являются ли транзакции подозрительными.

В результате мы пришли к такой функции, которая по 6 правилам определяет подозрительную активность

Алгоритм поиска мошенников

В заключение, этот проект с Unidays прекрасно иллюстрирует пользу машинного обучения. Несмотря на недостаток размеченных данных и отсутствие четких критериев для определения подозрительной активности, мы смогли разработать алгоритм с использованием нечеткой логики.

Этот опыт показывает, что машинное обучение способно решать сложные задачи, даже когда исходные данные ограничены, и это мощный инструмент для предоставления ценной информации в бизнесе и научных исследованиях.