您的位置首页  网络技术

网络爬虫技术总结网络技术基础协议网络技术专门网

  尽人皆知,当下的大数据行业草木皆兵

网络爬虫技术总结网络技术基础协议网络技术专门网

  尽人皆知,当下的大数据行业草木皆兵。克日,央视一则关于“揭秘套路贷背后的罪过长处链”的查询拜访报导,揭开上海、杭州两家大数据公司不法爬取数据为套路贷效劳一事,再次将高枕无忧的大数据行业推下风口浪尖。北京商报记者查询拜访发明,严羁系下,包罗同盾科技在内的多家大数据公司纷繁“断臂求生”砍掉爬虫营业。同时,也有协作企业应羁系请求自动停息与相干大数据公司的爬虫营业协作。业内普遍存眷的是,面临言论风浪四起、爬虫整理压顶,切掉主要红利营业的大数据公司该怎样求生?

  爬虫营业终究给同盾科技奉献了多大利润?砍掉爬虫营业又将对其运营形成如何的影响?北京商报记者一样向同盾科技发去了采访大纲,但停止发稿,对方未停止复兴收集手艺 特地网。

  不外,多位业内助士报告记者,爬虫效劳是大都大数据公司的主要红利点,停掉该营业后,其公司运营或将遭到重创。

  “大数据公司消费材料是海量数据自己,今朝这个行业除操纵爬虫手艺抓取数据外,就是找第三方购置数据,但第三方购置的本钱会腐蚀掉大部门利润,因而大多大数据效劳商城市挑选本人开辟爬虫抓取数据。”南京信息工程大学滨江学院财产传授刘峰婉言,若大数据公司截至爬虫营业,必将会让主业本钱急剧上升,本身价钱落空劣势,增长的本钱会让其丢掉市场,同时协作的效劳商也会挑选削减合功课务以至截至协作。

  北京商报记者留意到,前述报导中,上海大数据公司聚信立和杭州大数据公司同盾科技均出如今报导页面中。报导指出,该不法长处链中,为套路贷立功团伙供给数据支持效劳的公司,常常以大数据风控或大数据征信的面貌呈现,次要经由过程强迫告贷人受权,操纵爬虫手艺,在数百家网站不法爬取百姓的小我私家信息,包罗百姓身份考证、电信运营商通话详单、电商数据、公积金、社保信息、学历信息、外卖信息、法院信息等,再做成具体陈述,供给给套路贷立功团伙作为放贷催收根据,使得套路贷立功团伙,能够对受害人对症下药。

  多位业内助士报告北京商报记者,被央视截图点名的公司中,同盾科技是互金行业熟知的一家大数据风控公司。正好像盾科技官方声称收集手艺 特地网,其是一家智能风险办理平台,为互联网金融、电商、O2O、银行、保险等行业供给一站式风控反狡诈计划,效劳客户已超10000家。一知恋人士报告北京商报记者,比年来同盾科技的效劳客户次要是互金行业,次要经由过程输出数据、风控体系和建模效劳三种方法对外协作,红利形式包罗收取数据用度收集手艺根底和谈、体系模子用度收集手艺根底和谈,和部门模子分润用度等。

  关于前述公司被查一事及最新停顿,北京商报记者接踵向其停止了采访联络。此中,立木征信公司已被登记,联络德律风无人接通;魔蝎科技官网则显现因站点改换网址或效劳不不变等缘故原由能够没法一般会见,且联络德律风无人接听;公信宝官网一般,但联络德律风无人接听;而新颜科技事情职员则称对该变乱和最新停顿暂不分明;而至于天翼征信被查一事,北京商报记者向其事情职员讯问,停止发稿对方未有进一步回应。

  克日,央视一则关于“揭秘套路贷背后的罪过长处链”的查询拜访报导,将本不安静冷静僻静的大数据行业再次推下风口浪尖。该报导揭发了两家大数据公司不法赢利超10亿的细节。据警方流露,涉案的上海某数据公司,自2016年7月以来,操纵不法获得的百姓小我私家信息不法赢利1亿余元;而另外一家位于杭州的数据公司,一样操纵不法获得的百姓小我私家信息,为互联网放贷机构供给风控测评,不法赢利9亿余元。

  北京商报记者留意到,自本年9月起,同盾科技公司便不是很“承平”。9月16日晚间,业内传出同盾科技爬虫部分闭幕和开创人CEO蒋韬“跑路”等动静。9月17日,同盾科技告急公布辟谣声明称,CEO蒋韬克日不断在海内处置公司事件;触及爬虫手艺的产物数聚魔盒为子公司杭州信川科技有限公司(以下简称“杭州信川”)自力运营产物。今朝杭州信川已截至相干效劳,员工已一般调岗。

  整理压顶,大数据风控行业小心翼翼。在高枕无忧的态势下,包罗聚信立、杭州有盾、天机数据等公司纷繁停息爬虫效劳。别的,同盾科技也屡次声明称,自2018年便开端逐渐调解营业,停止今朝已局部截至相干效劳。

  山雨欲来风满楼,央行前述暴光内容并不是毫无前兆。在本年下半年,同盾科技便多次被卷入跑路或被查风浪。而在整理压顶下,包罗同盾科技在内的多家公司纷繁称停息爬虫营业。关于此事,北京商报记者向同盾科技多个协作方停止了采访,有企业称已在10月接到羁系告诉,停息了与同盾科技的爬虫营业协作;也有互金平台回应称今朝仍在协作,次要是基于大数据风控停止协作,但至于协作的细节内容,基于贸易条目限制暂未便流露。

  徐伟栋一样称,今朝从业者在逐渐合规化的同时,临时不宜再停止大的营业拓展,应顺着羁系的风向调解计谋。别的,本钱市场对大数据公司贸易形式的认知和估值模子也需同步改动收集手艺根底和谈。

  正如杭州电子科技大学副传授徐伟栋所称,这一轮整理对大数据行业来讲可谓是没顶之灾,虽然缘起冲击套路贷,但由此带出了大数据行业在数据不法贮存、利用与转移(并因而赢利)方面的深水区。

  关于前述央视暴光的内容、公司营业及客户占比状况,北京商报记者曾测验考试向同盾科技停止采访,但停止发稿,对方未有相干回应。

  但是在辟谣事后不到10天,9月26日,再有动静称同盾科技子公司爬虫营业卖力人被查。与此前辟谣差别的是,此次动静获同盾科技官方确认。9月27日,同盾科技官方回应称,“为共同警方查询拜访已经效劳的某第三地契位,杭州信川及有关职员正主动辅佐警方查询拜访取证,以辅佐相干部分查清该第三地契位的状况”。

  对此,前述资深人士称,大数据风控公司应将数据驱动的运营转为手艺驱动的运营。经由过程常识图谱、天然言语处置、物联网传感数据建模等深度进修探究,成为行业内的手艺供给商或是一条可行之路。

  另外一资深行业人士一样指出,本年下半年的大数据行业整理态势,反应了金融科技羁系落到了实处。数据获得的正当性、数据利用的正当性,将来羁系城市穿透式办理。他进一步猜测,大数据风控等金融科技效劳将来都将请求持牌,金融科技产物要经由过程认证。同时,行业也要增强和持牌机构协作,主动共同羁系整理。

  也恰是在行业严羁系下,包罗同盾科技在内的多家大数据风控公司开展踩下急刹车,一方面切掉数据爬虫营业收集手艺 特地网,另外一方面则不竭加大与持牌金融机构的协作。但是,风向骤转之下,面临言论风浪四起、爬虫整理压顶收集手艺根底和谈,又切掉主要红利营业的大数据公司,又该怎样在互联网金融下半场求生?

  同盾科技子公司爬虫营业卖力人被查一事,仅是大数据行业的一个缩影。究竟上,自本年下半年以来,大数据风控行业便草木皆兵。7月18日,立木征信法人及大部门员工被警方带走;9月初,魔蝎科技、新颜科技两家大数据风控效劳商相干职员也因涉嫌操纵爬虫手艺进犯小我私家隐私被警方查询拜访;9月11日,公信宝公司办公地被警方贴上封条,有知恋人士揣测被查缘故原由一样与其爬虫营业有关;紧接着9月12日,业内再曝天翼征信公司多位高管及员工被警方查询拜访的动静。

  别的,另外一名不肯签字的资深业内助士也指出,“停掉爬虫营业会对同盾科技等公司营业运营形成很大影响,由于金融机构需求数据和基于数据的其他体系层面协作。假如没无数据,金融机构协作志愿会大大低落”。不外收集手艺 特地网,该人士也指出,数据只是同盾科技公司此中一方面的支出,其另有大批当地化或云化布置的决议计划平台、线上存款办理平台,是不触及数据的,因而其运营能否遭到重创暂不得而知。

  刘峰则指出,今后次整理来看,行业一方面不克不及脚踏两船,需求正当合规地停止营业,躲避潜伏法令风险;另外一方面也要倒逼本身营业停止变革晋级,经由过程综合性的效劳和更高的附加值来动员本身大数据效劳的利润率。他进一步指出,从另外一层面来看,可以在此轮整理中存活下来的企业,也能从被裁减企业中获得更多市场,从而在将来受益。

  “这一波大数据行业整理中,触及的成绩包罗多方面,一方面是数据不法获得成绩,另外一方面则是操纵数据不法取利成绩。”多位承受北京商报记者采访的业内助士指出。当前,羁系曾经给金融行业大数据风控公司划下红线,只需未经许可不法获得、传输小我私家隐私数据、到场到套路贷和不法催收等环节,便会重办不贷。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186
  • 标签:网络爬虫技术总结
  • 编辑:田佳
  • 相关文章