互联网金融大数据应用中存在的问题

大数据的处理已经形成包括数据收集、清洗、整理、关联分析、数据挖掘、可视化等的产业链,互联网金融已经成为自然产生大数据的重要领域,因此大数据应用中出现的问题和面临的挑战在互联网金融大数据应用中也有体现,具体表现为大数据共享失联、内容失真、分析失能、处理失速和安全失控的风险,以下分别论述之。

大数据失联表现在数据的公开、联通、共享方面的不尽人意,一些企业包括政府部门不愿公开数据,也有的是怕监管而不愿上传数据,造成公开数据部门吃亏、不公开数据部门占便宜的状况,形成了囚徒困境的局面。 又如网贷平台信息披露缺乏统一标准,历史数据不充分,使得一些网贷评级机构依据这些信息建立的评级模型和结果的公信力有待实践验证和优化。

大数据失真表现在大数据中含有大量的噪声信息甚至是虚假信息,出现信息过载的问题。大数据的价值在于将巨量的小数据连接起来形成可辨别的模式,但是这些“小模式”中有相当比例是垃圾。如何从数据里检测噪声,去除垃圾,去伪存真,考验着我们对大数据处理的能力。文献[21]对此有深入的论述。

大数据分析失能表现在数据分析挖掘能力的不平衡,并非互联网金融的所有参与者都具备大数据分析挖掘的能力,如一些 P2P 平台和借款人的违约、破产、跑路,凸显了出资人和监管部门对 P2P 平台和借款人信用评估能力的缺失。事实上由于大数据的体量和处理速度,大数据需要并行化处理,传统的数据理论和挖掘方法已经不完全适用,需要在理论和方法有突破性进展。

互联网金融大数据应用中存在的问题

大数据处理失速表现在对大数据处理速度还不能满足各方的需求。大数据不仅表现在它的体量之大,还表现于数据来源、噪声水平和其他因素引起的其频率和内容变化之快,这些变化定义了一个大数据问题的复杂性。通常我们说大数据至少要达到 1TB 的量级,而大多数中小企业和个人并不具备这种处理能力。要解决大数据问题,我们需要先解决一些小数据问题,比如每天处理 1TB 数据的能力,意味着需要每秒处理 12MB 的能力,12MB 并不是一个大的数据量,关键是要在1秒内处理完毕,这是对确定体量数据处理速度的约束优化问题,是个困难的问题,显然这是对学术界和实务界提出的具有挑战性的课题。

大数据安全失控表现在用户信息的泄露和滥用、法律法规建设的滞后。比如利用客户交易信息进行轰炸式广告投放的过度营销,用户刷二维码支付、下载不安全的 App 可能泄露个人的信息,买卖用户信息的非法交易也时有可闻。此外由于互联网企业信息管理漏洞造成客户信息的泄露,如支付宝 20G 的用户信息外泄、黑客利用某照片分享应用网站的漏洞获取了数百万个账户的用户名和电话号码。因此信息安全问题是关系到互联网金融能否健康发展的关键问题之一,现有的信息安全手段难以满足大数据应用的安全要求,关于数据产权、数据公开、使用和安全方面的法律法规缺失,必须引起政府部门和互联网金融参与各方的高度重视。

想了解第一手电商行业资讯,请持续关注淘铺购网店转让平台

avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: