人工智能在风控中的运用,是否是伪命题?
人工智能数十年来一直在酿造,现在已经在各个领域开花并取得了成果,例如自主驾驶,面部识别和医疗服务。
在信用批准领域,没有人工智能技术将不可能进行大规模开发。
以下分享是Yiben Finance and Economics主办的“三天和两晚CRO闭门训练营”的摘录:人工智能的发展逻辑及其在信用审查中的应用。
01人工智能的应用
每六个月零一年,就会出现一些新技术。例如,随着Alphago的出现,人工智能技术进入了公众眼中。
Alphago击败了Lee Sedol,Alphago主人击败了Ke Jie。但是实际上,在Master之后,另一个版本的Alphago Zero以89:11的成绩击败了Master。
无需探索GO领域的人工智能。因此,该领域的人们希望将AI的技术能力应用于其他更有意义的领域,例如智能医疗和健康。
实际上,现在已经在许多地方使用了人工智能,例如自动驾驶。 Google的主要参与者之一已经使用了Google的街景和映射数据来尝试这方面。特斯拉目前是一家相对成熟的公司。不久前,百度还宣布,它将在今年7月大量生产无人驾驶驾驶。
在许多金融产品中,它们还具有面部识别和远程帐户开设的功能。还有面扫描登录。较早使用的是Alipay的Face-Scan登录和Apple的iPhone X,它们的成功率和安全性很高。
也有明智的安全性。在集中人群(例如高铁和机场)的地方,您可以实时捕获视频中的面孔信息。将这些信息与公共安全部或相关机构的后端数据进行比较之后,它对于反恐识别和逃犯的跟踪非常有效,并且可以形成强大的SKYNET。
此外,在客户,翻译,同时解释等领域都有许多智能转变。在此之后,这实际上是由于人工智能技术的成熟度。
如果您想了解人工智能,则需要将其追溯到人工智能行业的发展。
02人工智能发展的历史
它的起源于1956年。一位名叫McCarthy的学者在美国召集了一群伟大的人,在数学和计算机领域,例如信息理论的创始人克劳德·香农(Claude Shannon)和现在被称为人工智能之父的马文·明斯基(Marvin Minsky)。他们举行了为期两个月的会议,并试图总结什么是人工智能?
当时,第一台计算机发明只有十几年。人们想弄清楚计算机是否可以像人类一样聪明。
希尔伯特(Hilbert)的“ 23个问题”之一具有巨大的启蒙运动。他问,世界上所有的事物,命题和理论可以写入数学公式吗?
之后,这成为人工智能尝试的第一个方向。人们试图建立一个符号系统,并尝试使用符号系统在生活中所有问题中执行数据计算。当然,这不太可能。这个符号系统正在发展越来越复杂和难以理解。
当时,有些人认为仅逻辑是不够的,但是需要知识。因此,在1970年代和1980年代,出现了一个新的高潮 - 建立了一个专家系统,试图安装人们在计算机中拥有的所有知识,并允许计算机具有人工智能。
但是,该系统存在致命的问题,即它不能积极学习。新知识的产生很快,而手动劳动不可能将所有知识倾倒在其中。所以那时,我有了另一个想法 - 让机器独立学习。
1986年,引入返回算法使大规模多层神经网络的培训成为可能。一个里程碑的事件是,IBM的深蓝色在1997年首次击败了国际象棋领域。2012年,Imagenet图像识别竞赛和深度卷积神经网络算法的使用大大降低了图像识别误差率。在“查看特定图像”的问题上,人工智能第一次接近人类。到2016年,AI已成为每个人的著名概念。
03AI在信用审查的应用中
机器学习是人工智能发展的关键。
如何使用机器学习来进行信用审查贷款?该过程分为四个步骤。
1。数学问题的抽象实践问题。
要创建一个机器学习模型以供信用批准,我们必须首先了解实际问题并获得一批用户数据,例如年龄,性别,地区,收入等,并将其抽象为数学问题。
这就像在市场上挑选西瓜。我们想购买一个甜蜜的人,我们如何选择?这无非是看皮肤,无论是绿色还是白色,还是声音酥脆,还是瓜茎是新鲜的。基于这些子决定,形成了结论。如果您以数据或学术方式查看它,则可以将上述所有数据数字化。
第二步是执行特征过滤。例如,纹理中有三种情况,它们清晰,模糊且不模糊。根据成为好瓜的概率开yun体育app入口登录,成为好瓜的概率越清晰,成为甜瓜的可能性就越高。如果纹理可以预测它们是否是好瓜,那么这些数据是有价值的。除了纹理以及诸如根和触摸之类的有价值的数据外,您还可以制作数学模型。
第三步是,筛选好瓜的最大机会是什么?我们需要训练,最后我们将找到最佳的训练方法。
例如,如果您发现用户是来自某些敏感区域的组,则可以直接拒绝,因为该领域的坏人的可能性很高。如果有非敏感地区的人,则有很多情况。例如,成为公务员涉及一系列决定。如果不是公务员开元ky888棋牌官方版,那是另一系列决定。
根据这样的树,用户最终可以得出结论是否批准它,哪个形成了模型。在实际应用中,这棵树将更加复杂,并且有许多分支。不可能手动列出模型,这需要通过机器学习来学习模型。
步骤4:学习后,您需要评估该模型的质量,这是测试。
有几种常见的判断方法。第一个是ROC曲线,底部的水平轴是将坏人放入。在0.2时,这意味着将20%的坏人放入。中间的虚线是指随机猜测。如果模型非常接近这一行,则意味着该模型与猜测没有什么不同。如果模型启动,向左或覆盖区域越大,则模型效果越好。
其中,红线,蓝线,红线是对训练集的影响,而蓝线是对测试集的影响。一个好的模型应该具有非常接近甚至重叠的红色和蓝线。如果差异很大开yun体育官网入口登录app,那么从理论上讲,这只是很好,但是实际上,它将被打折。
第二个模型是分类能力的判断。
所谓的分类能力是了解好是坏的程度。例如,基于模型,可以向A和B贷款,那么谁更好? C也不能借用C,那么哪一个更糟?
一个更直观的例子就像芝麻片段,范围为350到950,对吗?那么,芝麻似乎不好吗?考虑其分类能力非常重要。 950人必须比750人更好,而拥有750人的人必须比有700人更好。如果一个得分750的人比分数为800的人更好且低于800人,那么其排名就不好。
该应用是关于在做出风险决策时是否会收紧或放松风险控制策略。如果您没有分类的能力,则无法做出此判断。如果您有分类的能力,则必须是严格的,并且只给出了更高的分数。排序能力是信用批准模型中非常重要的测量指标。