经产观察
IT资讯
IT产业动态
业界
网站运营
站长资讯
互联网
国际互联网新闻
国内互联网新闻
通信行业
通信设备
通信运营商
消费电子
数码
家电
通信运营商

行业震荡!大批数据公司被查:是爬虫之错还是催收的“锅”?

作者:habao 来源: 日期:2019-9-18 14:47:50 人气:

  过去一周,杭州、上海多家数据科技公司接连被查。其中杭州魔蝎科技公司(下称“魔蝎科技”)、杭州存信数据科技有限公司的办公地点已经被贴上了警方封条,魔蝎科技的官网也已经无法打开。

  上海一位从事金融科技行业多年的资深人士告诉南都记者,上述公司被查的原因很可能与违规使用爬虫数据以及催收有关。而就在几天前,一张网传截图显示,知名第三方数据服务公司聚信立宣布将暂停对外提供用户授权的运营商爬虫服务。

  在网贷行业,数据提供方通过爬取用户的央行征信报告,水电煤气使用等生活信息,以及在运营商、电商平台、社交平台上留下的行为信息,经过清洗、聚合形成数据产品,再提供给网贷平台评估放贷风险。

  作为常见的信息获取技术,爬虫在各个行业被广泛运用,为什么唯独在网贷行业碰了壁?使用爬虫批量获取信息的界限在哪里?是否获得了用户授权?催收公司有用爬取的他人电线*

  9月11日晚,每日经济新闻报道称,国内知名币圈项目公信宝运营主体——杭州存信数据科技有限公司被贴上了封条,封条上印有“古荡封”字样。公信宝股东之一、币圈知名人士李笑来当晚发微博称“做投资真的不是容易的事儿啊!”疑似回应公信宝被查。

  公信宝官网显示,公司成立于2016年,是一家以区块链为核心技术的数据科技公司,旨在提供企业间、个、企业与个人之间的数据交换服务,建构底层公有链,同时为打造进入区块链世界的通行证。

  事发后不到24小时,又有业内人士爆料称,12日上午11点多,天翼征信的总经理、副总经理以及市场人员被带走。据一本财经报道,有内部员工透露是因为天翼征信跟之前被调查的公司有合作,去主动说明情况。

  天翼征信官网显示,该公司成立于2014年,是中国首家运营商旗下征信机构,属于电信控股的子公司。有数据行业从业者对一本财经表示,“连国企都开始被调查了,可见数据行业的整顿力度之大。”

  据财经披露的一张《公信宝产品服务价格表》显示,公信宝提供了涵盖社保、学信网、京东、电信、移动、联通、智联招聘、芝麻信用分、微信、支付宝、人行征信数据等的爬虫抓取服务。

  上述资深人士对南都记者指出,魔蝎科技等数据公司主要做的是爬虫业务,只需通过用户的账户名和密码,梦见假牙掉了就可以爬取用户的所有通话明细,根据亲密度来提供给催收公司使用。

  2017年,南都记者曾在一家数据公司花3.8元买到了自己长达33页的运营商报告,内容涉及基本身份信息,近半年的通话记录详情、账单消费、出行信息和人脉关系等,并有详细的量化评分。

  此外,报告中还能看到借款人的居住地址,入网时长,通信记录,民间借贷、银行、P2P平台与互联网小贷等通信记录,甚至还有和澳门通信记录等。该公司还称可提供电商、社保、公积金、央行和学信网的数据。

  “在风控场景下,使用爬虫抓取公开数据进行比对虽然不是唯一手段,但的确非常重要”,安理律师事务所合伙人锐介绍,金融风控场景涉及到多种信息的交叉比对,比如检测用户是不是“羊毛党”或机器人。

  确定是真实用户之后,还要调查之前有无违约记录、是否进入了其他公司的,需要用户自己提供更多个人信息,一些公司还会要求借款人授权爬取在其他平台的交易记录。

  一名征信行业的从业者叶先生告诉南都记者,有爬虫业务的第三方数据公司本身不掌握数据源,只能对外爬取数据,别无他法。

  南都记者了解到,网贷公司会先接入数据公司的API接口,出现授权页面后,让用户输入账号和密码。然后数据公司在自家服务器上用爬虫模拟用户行为,登录相关网站获取数据。

  上海金融和法律研究院研究员傅蔚冈表示,爬虫爬取的信息分为公开和保密两种,前者如公开的网页信息,后者如任何公司都会采取措施的用户地址、交易记录甚至个人隐私等信息。“如果爬取的是后者,显然就涉及商业利益和个人隐私了”,他强调。

  锐也提到,对于平台上非公开的后台数据,如果使用各种技术手段绕过反爬技术措施爬取,涉嫌侵入计算机系统,有可能构成犯罪。不过,在他看来,出现问题的公司的数据来源往往不仅仅是爬取公开数据,也可能来自数据交易。

  《中华人民国网络安全法》第四十一条,网络运营者收集、使用个人信息,应当遵循、正当、必要的原则,公开收集、使用规则,收集、使用信息的目的、方式和范围,并经被收集者同意。

  “两高”的《关于办理个人信息刑事案件适用法律若干问题的解释》进一步明确,非法获取、出售或提供行踪轨迹信息、通信内容、征信信息、财产信息50条以上的即入罪。

  曾有大数据公司的相关负责人对南都记者表示,“我们本身不生产数据,也不买卖数据。所有的数据都是由客户授权,我们收的只是技术服务费用。”

  一位大数据专家告诉南都记者,大数据行业主要有三种业态:一种是提供数据服务的数据服务提供商;另一种是提供大数据软件、算法、引擎的大数据软件提供商;还有一种是将大数据、平台、服务、运营整合成体系的大数据集成服务提供商。

  “目前壁垒低、需求大、来钱快的就是第一种,主要应用于精准营销和金融风控”,他说,金融风控主要服务于金融领域的风险控制,例如个人互联网贷款的风险控制,所以相关数据绝大部分都属于个人信息,“也是现在黑市上卖得最好的”。

  对此,锐指出,催收是商业放贷中的正常环节,但一定要用户的个人信息。比如催收是不是获得了借款人的事前同意?是不是进行了人身甚至使用?有没有对不相干的他人造成?

  “很多时候放贷公司会把催收委托给第三方催收公司,甚至直接把债务连同用户的联系人信息卖给催收公司”,他对南都记者表示,双方在放贷环节上可能缺乏合规意识,没有把催收环节提前说清楚。

  在他看来,网贷平台要求借款人将直系亲属作为联系人还有合,但借款人不还钱就其手机联系人,就没有任何法律依据,还会引起反感,这也是目前催收整治的动因。

  “现在都在强调合规经营,隐私。”一名催收公司负责人方先生告诉南都记者,自家催收业务很早就暂停了,因为公司的甲方(主要是网贷平台)基本已经倒闭了。

  在他看来,目前针对大数据公司的监管,使得国内互联网金融行业大洗牌,至于洗牌之后的场景,谁也不知道。“现在的形势是行业出现恐慌,大家都不晓得何去何从。”他说。

  一名网贷公司相关负责人也告诉南都记者,目前行业里的爬虫业务类数据公司基本都已暂停,这不免对相关企业造成影响,比如在进行风控时,一些特征数据将会缺失。

  不过长远来看,他认为这次大数据行业整顿对行业是好事,尽早规范,就会减少很多不确定因素,让行业稳定发展。

  财成国际

推荐文章