Интеллектуальная система позволяет определять мошенничество в сфере автострахования с точностью 96%
Структура базы данных, применяемой для обучения и тестирования
Итоговая база данных, применяемая для обучения, содержит 21745 строк и 19 признаков. База данных для тестирования содержит 7249 строк и 19 признаков аналогично.
AccidentArea: Область, где произошло ДТП.
Возможные значения: 'Urban' (городская), 'Rural' (сельская)
Sex: Пол водителя.
Возможные значения: 'Male' (мужчина), 'Female' (женщина)
MaritalStatus: Семейное положение водителя.
Возможные значения: 'Single' (не женат/не замужем), 'Married' (женат/замужем), 'Divorced' (разведен/разведена)
Fault: Виновник ДТП.
Возможные значения: 'Policy Holder' (страхователь), 'Third Party' (третьи лица)
Year: Год выпуска полиса.
DriverRating: Рейтинг водителя.
Числовые значения, отражающие рейтинг водителя, от 1 до 5
Days:Policy-Accident: Количество дней между началом действия полиса и ДТП.
Days:Policy-Claim: Количество дней между началом действия полиса и подачей заявления.
PastNumberOfClaims: Количество предыдущих заявлений по страховым случаям.
AgeOfVehicle: Возраст автомобиля.
AgeOfPolicyHolder: Возраст страхователя.
PoliceReportFiled: Наличие полицейского отчета.
Возможные значения: 'Yes' (да), 'No' (нет)
WitnessPresent: Присутствие свидетелей.
Возможные значения: 'Yes' (да), 'No' (нет)
AgentType: Тип страхового агента.
Возможные значения: 'Internal' (внутренний), 'External' (внешний)
NumberOfSuppliments: Количество прилагаемых документов к заявлению.
AddressChange-Claim: Количество изменений адреса до подачи заявления.
NumberOfCars: Количество автомобилей, застрахованных в полисе.
BasePolicy: Основной тип полиса:
Liability (ответственность): Страхование ответственности покрывает убытки, нанесенные третьим лицам в результате ДТП.
Collision (столкновение): Этот тип полиса покрывает повреждения автомобиля страхователя в результате столкновения.
Comprehensive (комплексное): Комплексное страхование покрывает широкий спектр рисков, включая кражу, вандализм, природные бедствия и столкновения.
FraudFound: Наличие мошенничества. (предсказываемый признак)
Возможные значения: 'Yes' (да), 'No' (нет)
На матрице ошибок (confusiun matrix) хорошо видно, что число ложноотрицательных срабатываний модели равно 0.
Это означает, что модель не пропускает ни одного случая мошенничества.
При этом число ложноположительных срабатывания равно 260. Тем не менее, каждое ложноположительное
срабатывание, как правило, перепроверяется профессиональным страховщиком. Таким образом, достигается почти 100% качество обработки заявок, а также повышается продуктивность и скорость определения
мошеннических действий.
Итоговая точность модели равна 96%.
Это значение определяется как число всех верно классифицированных заявок деленное на общее число всех заявок.
Точность = (3365 + 3624) /(3365 + 3624 + 260) = 96%
Source Code