搜索
  • 11

    X
  • 12

    X
  • 易轶

    X
  • 尹正友

    X
  • 于琦

    X
重复内容

数据交易合规系列研究之八——公开收集数据来源的合法性探析

免费 李旻 时长/课时:10分钟/0.21课时 1个月之前
已学:1,794人 点赞 分享 推荐 收藏 设置

分享到微信

声音

  • 普通女声
  • 普通男声
  • 特别男声
  • 性感男声
  • 情感男声

语速

  • 0.7X
  • 1.0X
  • 1.5X
  • 2.0X
  • 3.0X
  • 4.0X

字号

  • 标准
  • 特大
确定 取消

本系列的上一篇文章已经对四种数据来源方式的合法性予以概述,本文将详细分析公开收集数据对数据产品交易的合法性、可交易性和流通性等方面可能产生的影响,以及在立法层面尚无明确标准的情况下数据交易所可以考虑的标准。

公开收集数据也被部分企业称为“自动化访问获取”,实现收集的主要方式为爬虫技术。由于多数网站运营为了维持网站正常运营、筛选真实用户,都会限制或禁止爬取内容,因此公开收集数据的合法性存在“先天不足”,进而影响数据产品的合法性和可流通性。

一、不确定的法律评价

我国现行法律法规并未对爬虫行为明确评价,只能通过个案判决抽象出评价爬虫行为及使用行为的标准。本系列文章曾将爬虫行为合法性的认定标准划分为三点:(1)取得数据的手段是否合法,即爬取行为是否遵守网站的数据访问控制或robots协议约定;(2)该数据使用目的是否合法,是否构成对原产品的实质性替代;(3)该收集是否会造成损害,是否会侵夺原产品的商业机会或增加原产品的技术运营成本,等等。但这一标准仅为最为简单、可参考的行为类型,实践中诸多因素都有可能导致法院对爬取行为以及数据使用行为做出不同评价。

例如,在大众点评诉百度案中,一审法院认为判断涉及信息使用的市场竞争行为是否具有不正当性,应当综合考虑以下因素:涉案信息是否具有商业价值,能否给经营者带来竞争优势;信息获取的难易程度和成本付出;对信息的获取及利用是否违法、违背商业道德或损害社会公众利益;竞争对手使用信息的方式和范围。二审法院虽然认为百度对大众点评信息的使用已经构成对后者的实质替代,其行为违反了公认的商业道德和诚实信用原则,构成不正当竞争,但同时认为:“在自由、开放的市场经济秩序中,经营资源和商业机会具有稀缺性,经营者的权益并非可以获得像法定财产权那样的保护强度,经营者必须将损害作为一种竞争结果予以适当的容忍。本案中,汉涛公司所主张的应受保护的利益并非绝对权利,其受到损害并不必然意味着应当得到法律救济,只要他人的竞争行为本身是正当的,则该行为并不具有可责性。”

而在海外,近期美国第九巡回上诉法院最近再次裁定HiQ爬取互联网上可公开获取的数据并不违反《计算机欺诈和滥用法》,“未经授权”概念确实不适用于公共网站,HiQ的行为符合社会公共利益。遗憾的是,“他山之石”并未回答领英使用该爬取数据形成数据分析产品是否也符合社会公共利益,即对于爬取数据背后的竞争法及数据权属纠纷未作讨论。

由于网站数据承载了个人信息保护、著作权或知识产权保护、商业利益保护以及网络安全等多种权利或权益,因此我国司法实践对于使用爬虫技术抓取其它网站信息的行为评价跨度极大,部分后果严重、行为恶劣的爬虫行为除了面临网站运营者、信息主体可能提出的侵权指控、不正当竞争指控外,可能还会面临刑事责任。由此形成的数据产品当然也存在较大合规风险,因此数据交易所必然会审慎对待此类数据形成的数据产品。

二、数据交易所的复杂立场

以国内主流类型来看,我国的数据交易所通常扮演着数据采购、供给、磋商、居间的作用,少数交易所如上海数据交易所兼任监管功能。相对于场外交易,数据交易所的优势就在于使数据交易行为更具有合规性,最大程度免除交易双方的后顾之忧。并且我国主流数据交易平台大多都具有国资背景,数据交易平台对数据产品的选择也会影响数据产业的行业合规和发展风向。

数据交易所若完全放开对公开收集数据方式形成数据产品的限制,则有可能导致大量爬虫侵蚀正常网站运营的秩序和利益。虽然法院对爬虫技术持中立立场,但在运营网站方面,《最高人民法院关于“中国裁判文书网”网站建设建议的答复》表明官方网站同样更多是爬虫程序的受害者而非受益者。

但若数据交易所完全排斥公开收集数据及其产品,则市场上大多数企业即使具备创新能力也会丧失入场资格和正当交易的机会,并进一步加剧数据垄断局面的形成。

因此尽管公开收集数据具有先天的合规劣势,但数据交易所并未完全拒绝公开收集数据形成的产品。在上海数据交易所的产品页面上,仅合合信息旗下的数据产品就有五家。借助《上海合合信息科技股份有限公司首次公开发行股票并在科创板上市申请文件的首轮审核问询函的回复》可以看到,非直接采购方式获取数据的方式在上海合合信息科技股份有限公司的数据来源中占比97.10%,五项数据中有四项都主要依赖自动化访问获取的数据。企业数据企业中通过自动化访问获取数据并形成数据产品更占多数。

综上,本文认为,数据交易所应当立足于保护数据创新、维护正当竞争、增加社会福利的目的,平衡网站运营者、数据爬取者以及数据主体、公共利益之间权益的比重,通过对数据来源审慎形式审查的方式把控数据产品合规性,包容公开收集数据行为具有的轻微瑕疵,鼓励数据产品创新流通。

三、公开收集数据的合规建议

理论而言,数据交易所对数据产品的评价态度应当与立法、司法保持一致。但公开收集数据的行为在立法上没有明确规定,司法上又缺乏统一、直接、简单的裁判规则。从数据交易所的角度而言,为避免数据产品上市后出现数据采集合规纠纷,对于此类公开收集数据很可能会采用较为严格的形式审查方式。

虽然数据交易所尚无公开审查文件,但地方指导性文件、数据企业申请上市过程中的审核材料等可以作为审查参考。结合上海市杨浦区人民检察院等部门发布的《企业数据合规指引》,以及上海合合信息科技股份有限公司近期公布的《首次公开发行股票并在科创板上市申请文件的首轮审核问询函的回复》中公布的内容,本文认为,为便于数据产品顺利上市,建议数据交易主体按照最严格的方式进行自我审查,具体措施包括但不限于:

(一) 在进行数据爬取前,首先针对目标网站进行技术评估,包括计划获取数据的类型、目标网站的性质、是否存在数据采集限制、网站能接受的爬虫访问量等;

(二) 将爬取计划送交公司法务部门依据法律、行政法规、行业自律公约等予以审核修订;

(三) 定期检查被采集网站的限制规定、数据类型、用户协议等方面是否发生变化,若存在变化则及时更新爬虫清单及政策,加强长期管理;

(四) 建立“熔断机制”,发现爬虫行为可能违反法律、行政法规或者行业自律公约、影响网络服务正常功能、或可能侵犯他人知识产权等合法权益时,应当停止访问、收集数据行为并采取相应补救措施;

(五) 设置首席数据合规官,专门分管企业数据收集合法等业务。

综上,尽管公开收集数据具有先天合规劣势,但并非完全禁止。若数据交易主体希望此类产品正常上市,则应当注意爬取行为具备正当目的、爬取行为适度合理、并未严重损害网站运营,同时建立配套合规审查措施,为产品上市保驾护航。


作者:卓伟伟、刘曦

来源:微信公众号“汉盛律师”


相关推荐:

数据交易合规系列研究之一——上海数据交易所的交易模式探析

数据交易合规系列研究之二——数据产品合规评估要点

数据交易合规系列研究之三——主要数据交易参与主体类型介绍

数据交易合规系列研究之四——典型数据产品类型

数据交易合规系列研究之五——企业信用信息对数据产品交易的影响

数据交易合规系列研究之六——数据产品用途对合规审查的影响

数据交易合规系列研究之七——数据来源的合法性探析

版权声明:著作权归作者所有,如需转载,请联系作者获得授权,并注明作者信息及文章出处
发布:李旻 编辑:点小读 责任编辑:点小读

还可以输入280个字 查看 《留言评论奖励规则》 发表评论

精选评论

(0)

公司决议下次,股东是否打赏的卡死了肯德基阿里

声音
  • 情感童声
  • 性感男声
  • 特别男声
  • 普通男声
  • 普通女声
语速
  • 0.7X
  • 1.0X
  • 1.5X
  • 2X
  • 3X
  • 4X
字号
  • 特大
  • 标准

作者

李旻
  • 文章50
  • 读者20w
  • 关注6
  • 点赞124

  李旻 高级合伙人律师/仲裁员

  高级合伙人,中共党员,汉盛纪委委员

  华东政法大学法学博士、留英法学硕士

  最高人民检察院民事、行政案件咨询专家

  上海电视台新闻综合“律师说”栏目特邀嘉宾

  上海市律师协会规划与规则委员会委员

  上海市律师协会社会责任促进委员会委员

  上海市律师协会互联网与信息技术业务委员会委员

  浦东科协第四届理事会常务理事

  浦东电商协会第三届理事会常务理事

  浦东新区律师青联秘书长

  浦东新区律师团委委员

  浦东法院首批特邀律师调解员

  李旻律师是上海汉盛律师事务所高级合伙人,同时还担任了中国产业电商联盟、上海市房产经济学会住房保障专业委员会、上海市互联网协会、上海市电子商务园区创新发展联盟、上海市电子商务服务业联盟、上海市浦东新区电子商务协会、上海市振华外经职业技术学校特聘专家顾问。李旻律师在重大民事、行政及刑事案件诉讼与仲裁、建筑与房地产、互联网金融与资本市场、电子商务、公司治理与并购投融资、知识产权、反垄断与反不正当竞争、国际贸易、政府法律顾问等领域具有丰富的实务经验,曾代理多起标的总额达数亿元的重大诉讼、仲裁案件以及数件在国内有较大影响力的案件,以其提供的专业、优质法律服务及符合预期的案件结果,获得客户的好评。

  【擅长领域】

  公司法律风控、互联网金融、建筑与房地产、并购投融资、电子商务、知识产权、反垄断与反不正当竞争、国际贸易、私人法律顾问及重大民商事争议解决等

  【所获殊荣】

  2010年上海世博会杰出志愿者

  2016年2011-2015年浦东新区法制宣传教育先进个人;浦东新区优秀志愿者

  2017年2016-2017年度浦东新区十佳最美青年志愿者;上海市律师协会第一届商事模拟仲裁优秀风采奖

  2018年2016-2017年度上海市优秀志愿者

  2020年2019-2020年度第八届浦东十大杰出青年律师

  【专业著作】

  2016年《中国电子商务发展报告2016-2017》

  2017年《上海市电子商务发展报告2017》

  2018年《上海市电子商务发展报告2018》;《P2P网贷平台的法律合规及实务》;《网贷中介机构良性退出指引手册》

  2019年《大数据商业应用与法律实务》

我也要当作者

思想共享 知识变现

点赞

(1) 更多

常见问题

  • 1、“点读”是什么?

    点读是点睛网APP中的一款全民学法的人工智能(AI)新产品。它能“识字”和“朗读”,它使“读屏”变“听书”,解放读者的眼睛和颈椎。它使“讲课”变“写作”,解放讲师的时间和身心。

  • 2、“点读”的作者?

    在点睛网PC或APP端注册,登录点睛网PC端个人后台,点击“我的文章”,填写作者信息并上传文章。当第一篇文章通过编辑审核后,即成为点睛网的正式作者。

  • 3、“点读”的文章?

    作者在点睛网个人中心发布文章,编辑审核合格的才能呈现给读者。作者只能发布自己写的文章,不能发布或转发他人的文章。更不能发布有违法律法规、政府规定,或公序良俗、文明风尚、社会和谐等文章。

  • 4、“点读”的审核?

    作者文章上传后,编辑将在工作日最晚不超过24个小时、非工作日最晚不超过48个小时内完成审核。审核未通过的,说明理由。文章评论的审核,参照以上周期。

记课时

数据交易合规系列研究之八——公开收集数据来源的合法性探析

消费:30点币 现有:0点币 课时:0.21课时/10分钟
确定

您好,以下是重要提示:

本网服务属虚拟电子产品,通过第三方平台支付,退费程序复杂且成本畸高。所以, 一经购买成功,概不支持退费请您理解。谢谢!

支付成功

恭喜您记录课时成功!

继续听课 选择文章
记课时

数据交易合规系列研究之八——公开收集数据来源的合法性探析

消费:30点币 现有:0点币(点币余额不足,还需支付533点币) 课时:0.21课时/10分钟
充值

您好,以下是重要提示:

本网服务属虚拟电子产品,通过第三方平台支付,退费程序复杂且成本畸高。所以, 一经购买成功,概不支持退费请您理解。谢谢!

文章查重申诉
0 /1000
提交申诉
提交成功

我们会尽快处理您的申诉意见,
请注意查看处理结果。

确认