![](../../img/imgIndex/xlk_logo2.png)
在前文,我们从宏观层面探讨了数据交易的主体和数据产品合规评估的要点,从中观层面讨论了企业信用、数据产品类型及用途对合规审查的影响。以上较为简略的讨论了数据交易合规的相关问题,之后进入微观层面,我们将着重分析数据产品本身,从合法性、可交易性和流通性等角度,细致讨论数据交易中可能涉及的标准和问题。本文首先讨论的是数据来源的合法性,根据数据采集的不同手段,我们将数据来源分为四类:公开收集的、自行生产的、直接采集的和间接获取的。本文将概括介绍以上四类数据来源,分析其合法性标准,同时也为之后的各类来源的细致讨论打下基础。考虑到目前大多数交易所的交易规则正在制定,尚未颁布,我们的观点和结论将结合现有的或正在制定的相关规范、标准、政策和文件,供业内人士探讨。
一、概述
数据交易作为目前热门话题,而作为数据产品交易基石的数据本身更是重中之重。我们认为,一个数据产品,除企业背景调查这类常规事项外,首先要审查的就是其数据来源的合法合规性。数据来源不合法或不合规,将直接否决该数据产品的合规性,也就更无从谈起进入市场进行交易。结合数据收集的不同手段,我们将数据的来源分为四类:公开收集、自行生产、直接采集和间接获取。
二、数据来源:公开收集
讨论该问题时,首先要明确两个概念问题,开放数据和公开数据。开放数据一般指任何人均有权获取并无条件使用的数据,而公开数据是指任何人都有权利访问,但只能在—定的条件下获取并使用的数据。其二者的区别在于能否无限制的获取并使用。
开放数据没必要讨论其来源的合法性,所以我们在此讨论的是公开数据的采集。
现今互联网领域,采集公开数据的主要手段是爬虫技术。数据爬虫是一种按照一定规则自动抓取互联网信息的程序或者脚本,通过编程模拟人类访问网站,从而自动实现对目标站点和目标信息的批量获取。
关于爬虫技术收集手段的合法性边界,我们认为可从几个角度考虑。
1. 取得数据的手段是否合法
我们认为,爬虫技术是中立的,但在使用时需要在技术的应用上对其使用的合法性进行限定,即划定爬虫技术合法使用的边界。合法的网络爬虫应当限于数据访问控制或robots协议约定的范围。
数据权利方基于其特定目的可以开放和共享数据,但是同样也有权采取措施禁止或限制对数据的访问或获取。一旦数据收集方采用爬虫技术绕开或者侵入该数据控制,则该行为是具有侵略性的,我们认为是不合法的。
如果数据权利方在robots协议或网页中告知了爬取的范围以及其他应遵守的义务,数据收集方超出了约定或告知范围,没有遵守相应义务,该行为具有违约性,我们认为这是不合法的。
2. 该数据使用目的是否合法
如果收集的目的是实质性替代被收集经营者提供的部分产品内容或服务,则我们认为是不合法的。
3. 该收集是否会造成损害
若该收集手段实质上妨碍被收集经营者的正常经营,不合理的增加运营成本,破坏其系统正常运行,则我们认为是不合法的。
三、数据来源:自行生产
自行生产的数据指的是企业自身在经营、科研、生产过程中产生的数据,包括但不限于研发数据、生产运行数据、管理数据、运维数据、业务服务数据等。该类数据在数据交易中多采用数据包或数据API接口的形式,为其他企业的研究、经营提供数据支持。因该类数据的收集来源仅涉及企业自身,故我们认为自行生产的数据来源的合规审查重点在于企业数据分类、安全和记录。
在《工业和信息化领域数据安全管理办法(试行)》(征求意见稿)中,根据数据的行业要求、特点、业务需求、数据来源和用途等因素,将数据分为了一般数据、重要数据和核心数据。在审查过程中,需要审查不同数据等级的数据安全机制,保障在数据交易过程中,不会发生数据安全问题和泄露风险。
同时,针对不同的数据类型,审查时要求提供的证明文件也是不同的,例如,针对生产数据,可能要求企业提供其生产的控制信息、工况状态、工艺参数、系统日志等;针对运营数据管理数据,则要求企业提供设备信息、数据库模型、客户数据及运维日志等。
四、数据来源:直接采集
该采集数据可分为个人信息数据采集和非个人信息采集。
针对非个人信息采集,该采集手段一定程度上与公开收集相重合,但又因为其行业的不同,故需按照相应行业数据规定审查其采集合法性,较为复杂,本文暂不讨论。
针对个人信息采集,个人信息能否交易的问题,我们认为将个人信息去标识化,切断逆向追诉个人途径,将信息转化为数据后,是可以进行交易的。
关于个人信息收集的合法性问题,除了依据《个人信息保护法》的同意、合理及最小化三个原则外,一些相关标准和规定也应当纳入作为审核依据,例如,《常见类型移动互联网应用程序必要个人信息范围》,《信息安全技术-个人信息安全规范》《信息安全技术-个人信息去标识化效果分级评估规范》《信息安全技术-移动互联网应用程序(APP)个人信息安全测评规范》《信息安全技术-个人信息处理中告知和同意的实施指南》。(上述部分标准处于征求意见或处于正在批准过程中)
五、数据来源:间接获取
该种收集手段多为数据采购或授权许可。对于该类数据来源,我们认为,不仅要审查采购协议或授权许可协议的真实性、合理性外,还需要按照上述标准,审查其所有“前手”数据来源的合法性,确保“前手”的每一手的数据收集和交易均符合规定,避免企业受到其他权利方的权益请求。
因为现行理论界对于数据确权的争议较大,而数据的间接获取又受数据确权的影响,不同的数据权属(物权、债权、知识产权等),其间接获取的审查方式不同,故本文中不多做讨论,放于日后。
六、总结
数据作为数据产品的根本,其来源合法性将直接影响着整个数据产品的合规审查。本文从四种数据采集手段简略分析了其数据产品的数据来源合法性,需要说明的是,以上仅是对我们认为的数据来源合法性审查的概述,对于上述几种方式的审查细节,我们将会在后续文章继续探讨。
作者:李旻、卓伟伟
来源:微信公众号“汉盛律师”
相关推荐:
公司决议下次,股东是否打赏的卡死了肯德基阿里
李旻 高级合伙人律师/仲裁员
高级合伙人,中共党员,汉盛纪委委员
华东政法大学法学博士、留英法学硕士
最高人民检察院民事、行政案件咨询专家
上海电视台新闻综合“律师说”栏目特邀嘉宾
上海市律师协会规划与规则委员会委员
上海市律师协会社会责任促进委员会委员
上海市律师协会互联网与信息技术业务委员会委员
浦东科协第四届理事会常务理事
浦东电商协会第三届理事会常务理事
浦东新区律师青联秘书长
浦东新区律师团委委员
浦东法院首批特邀律师调解员
李旻律师是上海汉盛律师事务所高级合伙人,同时还担任了中国产业电商联盟、上海市房产经济学会住房保障专业委员会、上海市互联网协会、上海市电子商务园区创新发展联盟、上海市电子商务服务业联盟、上海市浦东新区电子商务协会、上海市振华外经职业技术学校特聘专家顾问。李旻律师在重大民事、行政及刑事案件诉讼与仲裁、建筑与房地产、互联网金融与资本市场、电子商务、公司治理与并购投融资、知识产权、反垄断与反不正当竞争、国际贸易、政府法律顾问等领域具有丰富的实务经验,曾代理多起标的总额达数亿元的重大诉讼、仲裁案件以及数件在国内有较大影响力的案件,以其提供的专业、优质法律服务及符合预期的案件结果,获得客户的好评。
【擅长领域】
公司法律风控、互联网金融、建筑与房地产、并购投融资、电子商务、知识产权、反垄断与反不正当竞争、国际贸易、私人法律顾问及重大民商事争议解决等
【所获殊荣】
2010年上海世博会杰出志愿者
2016年2011-2015年浦东新区法制宣传教育先进个人;浦东新区优秀志愿者
2017年2016-2017年度浦东新区十佳最美青年志愿者;上海市律师协会第一届商事模拟仲裁优秀风采奖
2018年2016-2017年度上海市优秀志愿者
2020年2019-2020年度第八届浦东十大杰出青年律师
【专业著作】
2016年《中国电子商务发展报告2016-2017》
2017年《上海市电子商务发展报告2017》
2018年《上海市电子商务发展报告2018》;《P2P网贷平台的法律合规及实务》;《网贷中介机构良性退出指引手册》
2019年《大数据商业应用与法律实务》
我也要当作者思想共享 知识变现
点读是点睛网APP中的一款全民学法的人工智能(AI)新产品。它能“识字”和“朗读”,它使“读屏”变“听书”,解放读者的眼睛和颈椎。它使“讲课”变“写作”,解放讲师的时间和身心。
在点睛网PC或APP端注册,登录点睛网PC端个人后台,点击“我的文章”,填写作者信息并上传文章。当第一篇文章通过编辑审核后,即成为点睛网的正式作者。
作者在点睛网个人中心发布文章,编辑审核合格的才能呈现给读者。作者只能发布自己写的文章,不能发布或转发他人的文章。更不能发布有违法律法规、政府规定,或公序良俗、文明风尚、社会和谐等文章。
作者文章上传后,编辑将在工作日最晚不超过24个小时、非工作日最晚不超过48个小时内完成审核。审核未通过的,说明理由。文章评论的审核,参照以上周期。
本网服务属虚拟电子产品,通过第三方平台支付,退费程序复杂且成本畸高。所以, 一经购买成功,概不支持退费请您理解。谢谢!
本网服务属虚拟电子产品,通过第三方平台支付,退费程序复杂且成本畸高。所以, 一经购买成功,概不支持退费请您理解。谢谢!