人行个人信用报告OCR解析-深源恒际科技有限公司

【AI技术:人行征信报告-征信查询-信用报告-信用报告解析】1代、2代征信报告OCR识别,结构化输出文本:个人基本信息、信息概要、信贷交易信息明细、公共信息明细、查询记录。
了解咨询

雷达评级

A

用户规模

-

产品上线

-

二代征信报告人行明细版识别

接口地址
https://dfv2creditpdf.apistore.huaweicloud.com/v2
响应格式
application/json
请求方法
POST
请求参数 (Headers)
参数类型必须描述
Content-Typestring
string
application/x-www-form-urlencoded
请求参数 (Query)
参数类型必须描述
keystring
string
请求 AccessKey, 请在控制台中查看

商品详情

商品亮点
  • 准确率高:字段准确率高达99%以上
  • 全字段结构化:支持人行征信版全字段结构化输出
  • 极速响应:单页识别时间<3S
  • 结构化信息、包含个人基本信息、信息概要、信贷交易信息明细、公共信息明细、查询记录
商品说明
版本: V1.0 交付方式: API
适用于: 其他 上架日期: 2020-04-21
注意事项:
1代、2代征信报告接口上传的请求参数为:urlencode格式的PDF版征信报告的base64编码数据;
授信机构版征信报告接口上传的请求参数为:urlencode格式的HTML版征信报告的base64编码数据。
因商城限制,上传的请求数据大小不超过2M,如超过2M,可联系客服解决。
具体调试方式与编码转译,可下载参考使用指南。


简介:在处理借贷业务时,信贷机构会通过用户既往信用记录分析、判断用户还款意愿,以便预见性地规避风险、减小坏账率。然而,由于征信信息涉及个人隐私,央行征信中心不面向第三方机构开放征信数据,同时,在复杂的竞合关系下,各信贷平台也常常对打通信息孤岛共享数据持观望态度,导致信贷机构获取用户信用信息的门槛相对较高。目前,办理贷款业务时,信贷机构只能在获得用户授权的情况下从央行征信中心调用征信报告,以便获得用户信用信息。拿到报告后,需要通过人工方式把核心信息一一录入风控模型,用于分析、评估潜在风险,进而作出相应决策。
问题在于,人工录入作业量大、相对耗时,难免影响贷款审批效率,造成意向客户的流失;抑或为实现快速放款,业务部门处理征信数据时删繁就简,因疏漏或主观判断造成风险评估不够精准。
基于这一现状,深源恒际推出征信报告信息结构化提取解决方案,帮助借贷平台提升服务效率、降低人力成本。基于OCR识别技术,结合专项训练和自适应提取方法,深源恒际开发了征信报告专用识别模型,可自动识别、提取征信报告上的文字信息,并输出结构化文本,实现信息采录自动化。
在实际应用场景下,会出现诸多干扰识别效果的因素,如文本不清晰、旋转畸变等。测试数据显示,基于OCR完成整份征信报告的识别录入,用时约为20s-30s;而人工录入整份报告耗时约1-2小时,作业效率大幅提升。另外,在识别精度上,算法模型的字段准确率已达99%。
OCR技术在信贷业务中的应用,实现了征信报告识别录入自动化,优化业务流程的同时,也提升了业务处理效率,让信贷服务能够更加高效、便捷地触达用户。

用户案例

信用报告OCR结构化提取+智能解析 两步实现授信审核智能化
客户公司简介:济南曜派信息科技有限公司于2017年底在泉城济南成立,简称“曜派科技”。是一家致力于大数据、云计算、人工智能、机器学习、区块链等前沿技术在金融领域创新和应用的科技服务型企业、双软认证企业。公司核心系统产品以“五曜”古称命名,目前已研发上线的有:“启明”智能信贷系统、“重华”智能金融综合服务平台、“安周”智能决策引擎、以及“镇星”金融风险智能监管平台。

客户声音:一份20页左右的征信报告一般包括2000个左右的字段,人工录入成本为 0.5人天/份报告,按照北京地区的人力成本约130元/份,但机器的录入成本是人力的1/10,此外人工录入一份报告的时间需要3~5个小时,机器只需要1~2分钟。一台机器可以不眠不休,一天可以处理1440份报告,相当于720个人的工作量。

客户企业规模:50-100人

服务故事(简化版):以个人信用报告为例,个人信用报告分为本人版与授信机构版。其中,本人版是指用户本人通过征信中心临柜申请或通过互联网在线申请等途径查询到个人信用报告,提供给授信机构的文档形式多为纸质版扫描件或电子文档;针对本人版个人信用报告的智能解析,主要是基于OCR技术对所识别、提取的文字信息进行结构化输出的过程,最终返回JSON格式的结构化文本,向智能风控系统输入有效信息,为风险把控提供重要参考。