我的车部落
登录 注册
车部落导航
郑州车市
当前位置:首页>新闻中心>技术课堂>正文

车险数据分析与商业价值

2018年08月30日 11:11 来源:车行天下 超过:5379次关注 微信新浪微博腾讯微博QQ好友 扫描二维码,分享给朋友:

随着道路交通行业的持续发展,我国民用汽车保有量呈现逐年快速增长的趋势。而汽车行业的繁荣为车险行业提供了蓬勃发展的平台,为车险产品带来了广阔的发展空间。车险产品主要通过车因素、人因素和环境因素三个方面衡量被保险人的风险水平,从而确定保费。除此之外,司机的驾驶行为也是衡量风险的重要因素,对车险保费定价有指导作用。

此次狗熊会使用某保险公司提供的车险数据,共4233条记录。数据共包含11个变量。其中,因变量为某年度的车险理赔金额,当理赔金额为0时,代表当年没有出险;当理赔金额大于0时,代表实际的出险金额。我们将因变量处理成0-1变量,即某年度是否出险,通过后续建模挖掘影响出险行为发生与否的重要因素。自变量即为相关影响因素,可分为汽车因素和驾驶人因素两类。


车险数据分析与商业价值


车险数据分析与商业价值


驾驶人因素共包含四个变量:驾驶人年龄、驾驶人驾龄、驾驶人性别和驾驶人婚姻状况。通过简单的描述分析,能够得到如下结论:

驾驶人年龄:出险和未出险驾驶人年龄的平均水平(中位数)和波动水平的差异并不明显。

驾驶人驾龄:出险驾驶人驾龄的平均水平(中位数)要明显低于未出险驾驶人,说明新手司机更有可能出险。

驾驶人性别和婚姻状况:女性驾驶人的出险率更高,但样本量远小于男性驾驶人;未婚驾驶人出险率略高,但样本量远小于已婚驾驶人。初步的结论是:驾驶人的性别和婚姻状况可能对出险行为有影响。然而,这种影响也可能是由于数据本身的样本量差异形成的。


车险数据分析与商业价值


数据中汽车因素包括六个变量:汽车车龄、发动机引擎大小、是否进口车、所有者性质、是否有固定车位和是否有防盗装置。

首先将车龄变量和引擎大小变量进行离散化处理,即将车龄为1年的看作是新车,车龄大于1年的看作是旧车;将引擎小于等于1.6升的车看作是普通级,引擎大于1.6升的看作是中高级。可以看出,新车出险率更高,普通级车辆出险率更高。因此可以初步判定汽车车龄和车辆级别会影响出险行为。


车险数据分析与商业价值


另外,有防盗装置、有固定车位、进口车以及私人车的出险率略高。值得注意的是,样本量在有无防盗装置、有无固定车位、是否进口车和所有者性质的不同水平之间,分配并不均匀。因此,这种差异是否显著,需要借助后续建模结果进行判断。


车险数据分析与商业价值


通过对数据的描述性分析,本案例认为汽车本身的属性特征、驾驶人的特征都很可能会影响出险行为的发生与否。

为了深入挖掘影响出险的显著因素,本案例将建立出险因素的0-1回归模型(logistic模型)。考虑到模型涉及诸多自变量,本案例试图建立模型选择的AIC和BIC标准,并综合模型的复杂程度和预测精度,选择最利于刻画出险行为影响因素的统计模型。感兴趣的读者可以通过“阅读原文”购买案例进行学习。

通过车险数据的出险因素统计模型,可以得到一些十分具有应用前景的信息。

(一)个性化车险定制

近年来国外保险公司产生一种新的车险费率厘定模式,即UBI驾驶人行为保险。UBI的理论基础是驾驶习惯良好的驾驶员应获得保费优惠,保费取决于实际驾驶时间、具体驾驶方式等指标的综合考量。保险公司可以直接检测和评估驾驶行为,当车辆发生事故时,车载设备记录下的事故速度以及相关信息会使得理赔评估和处理更有效率。

本案例的出险因素模型即可应用于UBI,制定个性化车险产品。根据影响出险的显著因素(如车龄、驾龄),对其“出险概率”进行预测,并根据预测结果及驾驶人驾驶特征制定适当的保费标准。不仅如此,还可以进一步结合驾驶行为数据,制定基于驾驶行为的UBI车险产品,如对具有“良好”驾驶行为特征的驾驶人给予保费优惠,对具有“不良”驾驶行为习惯的驾驶人适当提高保费。

(二)人群细分

上述的出险因素模型还有一个十分有价值的应用领域:出险人群细分。大致做法是:首先按照AIC模型的预测出险概率进行从高到低排序,然后将排序后的驾驶人等分成5份,代表从高到底5种不同风险人群。将人群进行了细分之后,可以计算这5种人群的实际出险概率。


车险数据分析与商业价值


经过计算,根据AIC模型识别出的低风险人群占总人群的20%,而其实际出险率只有17%,比样本的整体出险率28%低了11%。模型比较好地识别出了不易出险地人群。对于人群风险等级的划分,也可以应用到UBI车险产品中,对高风险人群收取高保费,对低风险人群适当减少保费。


车险数据分析与商业价值


狗熊会探究的出险因素模型在样本量和变量个数上都较小,因此仍存在一些不足、需要完善。另外,在未来探索中还可以开展更多的研究方向。

1. 本研究的预测结论是基于内样本得到的,这样会高估模型预测精度;未来获取到更多样本时可以对外样本进行预测,这样得到的结论更加有说服力。

2. 模型中的变量较少,未来可以考虑驾驶行为数据来完善模型,制定基于驾驶行为的UBI车险产品。

3. 研究中把出险行为简单地定义为是否出险,在未来可以结合出险险种等数据,预测出险金额。

文章源自狗熊会,转载不得用于商业活动。

狗熊会介绍:致力于数据产业的高端智库!聚数据英才,助产业振兴!狗熊会以数据治理为核心,以数据资源资产化为目的,帮助合作伙伴制定数据战略,培养数据人才,研究数据业务,发现数据价值,推动产业进步!

文章标签:车险数据分析

编辑:薛成

说两句……忘记密码?|注册

0-500 字已有评论 0条 查看评论>>