搜索
  • 11

    X
  • 12

    X
  • 易轶

    X
  • 尹正友

    X
  • 于琦

    X
重复内容

数据|数据抓取行为的法律风险及合规建议——基于案例和场景的探讨

免费 吴丹君 时长/课时:16分钟/0.35课时 1个月之前
已学:895人 点赞 分享 推荐 收藏 设置

分享到微信

声音

  • 普通女声
  • 普通男声
  • 特别男声
  • 性感男声
  • 情感男声

语速

  • 0.7X
  • 1.0X
  • 1.5X
  • 2.0X
  • 3.0X
  • 4.0X

字号

  • 标准
  • 特大
确定 取消

数字经济时代,数据抓取已成为企业获取信息、优化战略和提升竞争优势的重要手段。然而,随着数据抓取技术的不断发展和应用,其背后所隐藏的法律风险也日益凸显。不当的数据抓取行为可能导致企业陷入法律纠纷,甚至面临巨额赔偿和信誉损失。因此,对于企业而言,深入了解数据抓取的法律风险,制定有效的管理策略显得尤为重要。本文将结合具体案例和场景,对数据抓取行为的法律风险及合规建议进行深入探讨,以期为企业提供有益的参考和指导。

一、典型案例回顾

(一)擅自抓取微博后台数据不正当竞争案

在(2019)京73民终3789号案中,微梦公司作为新浪微博的运营方,与负责鹰击系统运营的蚁坊公司之间产生了法律纠纷。蚁坊公司采用技术手段直接获取、存储、展示和使用微博平台的数据,并对这些数据进行加工处理形成分析报告,通过鹰击系统其用户提供相应的数据服务。对此,微梦公司认为蚁坊公司的行为构成了不正当竞争,并将此事诉至法院,要求蚁坊公司立即停止不正当竞争行为,消除影响并赔偿由此造成的经济损失。

法院经审理认为,蚁坊公司利用技术手段破坏或绕开了微梦公司所设定的访问权限获取微博平台的非公开数据,干扰了微博平台的正常运行,并影响了微梦公司对外授权并获得相关收益的能力。因此,法院判定蚁坊公司的行为违反了《反不正当竞争法》第十二条的规定,构成了不正当竞争行为。

(二)公开房源信息抓取案

在(2022)京73民终4201号案中,原告在其房产经纪业务过程中收集、制作并积累了大量房源数据,形成了一个规模庞大的房源数据集,这些数据在贝壳网商向用户开放使用。然而,被告未经授权,采用技术手段擅自抓取并存储了贝壳网上的房源信息、交易信息、户型图等数据,不仅移除了抓取图片的水印,还将这些数据通过网络提供给其用户或公众。原告认为被告行为侵犯了其合法权益,以不正当竞争为由诉至法院,请求判令被告停止侵权、消除影响并赔偿经济损失。

法院经审理认为,涉案数据虽是向公众无差别提供和展示的公开数据,但并不意味着其他经营者可以不受任何限制地获取和使用这些数据。被告通过规避或绕开网站技术保护措施的方式大规模抓取涉案数据的行为不具有正当性,客观上导致了“虚假房源”信息的大量产生和传播,同时损害了原告基于这些数据获得的竞争优势和交易机会,增加了原告的运营成本,因此构成不正当竞争。

二、数据抓取行为的法律风险分析

司法实践中,数据抓取技术本身被视为一种中立的工具,其使用并不当然带有法律上的可责性。正如(2021)最高法知民终1687号案中,最高院认为,即使爬虫技术曾被用于违法活动,但并不等于该项技术本身具有违法性。然而,当数据抓取技术与特定的应用场景相结合时,其合法性与正当性便成为法律评价的关键。法院在裁判过程中会综合考量数据抓取的手段、目的、所涉及的数据类型、内容、规模等多个维度,以评定该行为是否逾越了法律所允许的边界。当前,数据抓取行为主要可能触及以下法律风险:

(一)不正当竞争风险

正如上述经典案例,不正当竞争风险是数据抓取行为中最为常见的法律问题。通过对相关案例的梳理,构成不正当竞争的数据抓取行为通常涉及以下几个特点:

1.实质性妨碍和破坏平台的正常运行

数据抓取行为如果超出了合理使用的范围,可能会对被抓取平台的正常运行造成实质性妨碍和破坏,从而构成不正当竞争。例如,通过高频次的自动化访问占用大量的服务器资源,导致服务器响应速度下降,影响正常用户体验。同时,数据抓取行为导致的异常流量掺入还可能干扰平台的流量分析和决策系统,造成数据分析失真,从而影响平台的商业决策和运营效率。

在司法实践中,法院会综合考虑数据抓取方式和数据抓取行为对平台造成的实际影响,包括服务器负担、运营成本增加、用户访问体验下降等,来判断该行为是否构成不正当竞争。如果数据抓取行为导致了上述不利后果,法院可能会认定其违反了《反不正当竞争法》的相关规定。以(2023)浙民终1126号案件为例,涉案软件通过规避天猫的反爬机制,对平台服务器进行高频、非法访问,从而抓取大量平台商品的主图、标题、价格和详情等数据进行搬运。法院认为,被诉数据爬取行为增加了天猫平台内的不正常流量,妨碍了平台的流量监控和服务效能,冲击了平台的经营方式和盈利模式,从而实质性破坏平台经营者的合法正常经营活动,构成不正当竞争。前述“擅自抓取微博后台数据不正当竞争案”中,法院也持有相同的观点,认为蚁坊公司实时抓取大量微博平台数据,会给微博平台服务器的正常运行造成额外负担,加大微梦公司的运营成本,对微梦公司权益造成了实质性损害。

2.实质性替代对方的网络产品或服务

除了对平台运行造成影响外,数据抓取行为还可能因为实质性替代他人的网络产品或服务而构成不正当竞争。所谓“实质性替代”,是指行为人通过非法手段获取他人数据,并将其作为自己产品或服务的内容向公众提供,从而在实质上取代了他人原有的产品或服务。这种做法不仅侵犯了他人的合法权益,也扰乱了市场的公平竞争秩序。

通过公开途径检索,不难发现已有数十起案件将"实质性替代"作为判定数据抓取行为构成不正当竞争的核心要素。其中,大众点评诉百度不正当竞争案便是一个典型案例。在该案中,法院认为,百度地图通过大量使用大众点评网的点评信息,实质上替代了大众点评网向用户提供的服务,侵占了大众点评网的潜在流量和商业机会。这种抓取他人数据资源并使用的行为,削弱了大众点评网的市场地位,对其造成了实质性的损害,因此被认定为不正当竞争行为。

在判断是否存在实质性替代时,法院会考虑多个因素,包括所抓取数据的规模、利用被抓取数据提供的产品或服务是否与他人高度相似、数据抓取和使用行为是否导致他人的用户流失或商业机会丧失等。如果数据抓取和使用行为构成了对他人产品或服务的实质性替代,那么该行为可能会被认定为不正当竞争。

3.侵害数据主体的合法权益

在数字化商业环境中,数据的合法收集与使用是企业运营的重要组成部分。商业数据,尤其是那些通过用户与平台交互产生的数据,往往涉及复杂的数据处理规则和用户隐私权益,平台对于其合法收集的数据拥有自主处理权,有权依据自身规则进行数据展示和运营。当数据抓取行为侵犯了数据主体的合法权益,并对平台的竞争优势构成损害时,该行为有可能会被法院认定为不正当竞争行为。

在(2021)京73民终1011号案中,被抓取的数据(短视频、注册用户、用户评论)具有数据集合属性,其数据规模大、内容全面、商业价值高,原告对上述数据集享有竞争性利益。被告未经许可,直接抓取搬运涉案数据集合中大量短视频和用户评论在其运营的APP中使用,损害了原告的竞争性利益,不具有正当性。同时,被告抓取用户个人信息后在其APP中使用,既未经过网络用户的同意,亦未经过原告的许可,该行为不但会侵害用户个人信息所有权,还会打破平台和用户之间的信任平衡,削弱用户对平台的粘性,对原告的经营管理造成不利影响。法院认为,被告数据抓取行为损害了原告的竞争优势,破坏了行业市场竞争秩序,构成不正当竞争。

(二)知识产权侵权风险

除了潜在的不正当竞争风险之外,数据抓取行为亦可能触碰到知识产权侵权的红线。通常,仅对受知识产权保护的数据进行访问或抓取,并不直接构成侵权。然而,数据抓取后的使用过程却有可能涉及到侵犯相关的知识产权。例如,借助数据抓取技术对软件代码、文学作品、音乐、视频等受版权保护的材料进行复制、分发或公开展示时,将直接侵犯知识产权权利人的合法权益。

在(2018)沪0110刑初150号案和(2020)京0108刑初237号案中,被告人使用爬虫技术抓取了他人正版电子图书数据,随后在其推广运营的App中将这些图书数据提供给他人访问、下载,并通过广告和付费阅读模式进行商业牟利。法院审理后认定,被告人的行为侵犯了著作权人的合法权益,构成了侵犯著作权罪。

(三)侵犯个人信息权益风险

根据《个人信息保护法》的规定,处理个人信息应当遵循公开、透明原则,公开个人信息处理规则,明示处理的目的、方式和范围。同时,处理个人信息应当取得个人信息主体的同意,或者具备其他合法性基础。

在司法实践中,数据抓取行为人有时会以“已公开个人信息”为由,证明其抓取行为的合法性。然而,法院在判断此类抗辩是否成立时,会综合考量多种因素,包括但不限于信息的公开程度、抓取行为的性质和目的、对个人权益的影响等(具体请见:团队原创 | 从司法实践看已公开个人信息处理的合规要点)。对于非公开的用户数据,未经授权的抓取行为可能侵犯个人信息主体的合法权益。以(2021)浙0110民初2914号案件为例,被告非法抓取原告“抖音”直播平台的非公开数据,包括用户打赏信息、主播收益等,并进行公开展示。尽管被告抓取的数据未直接包含用户的真实姓名,但结合主播的昵称、头像、直播形象等信息,可以识别出具体的个人。被告未经打赏用户及主播同意,擅自抓取并公开这些信息,其行为缺乏合法性基础,侵犯了用户的个人信息权益。

三、数据抓取行为的合规建议

为了确保数据抓取行为的合规性,降低潜在的法律风险,建议企业在使用数据抓取技术时,从“事前评估、事中监督、事后管理”三个方面入手,构建全面的合规框架。

(一)事前评估:全面考量与风险防范

企业在进行数据抓取前,应对拟抓取的数据进行充分了解和全面评估,包括拟抓取数据的类型、规模、来源、抓取的目的和方法等。对于涉及个人信息的数据抓取,企业应当确保行为的合法性和必要性,尽管抓取已公开的个人信息,原则上无需征得个人信息主体的同意,但必须在合理的范围内进行。对于商业数据的抓取,企业则应关注目标网站是否采取了反爬措施,抓取行为是否可能对网站的正常运行造成不利影响。特别是当两家企业的商业模式类似,且获取对方数据可能会给其造成竞争性损害时,企业应格外警惕。

(二)事中监督:持续监控与合规性审查

在数据抓取的实施过程中,企业需采取持续的监控机制,以确保数据抓取活动符合法律法规的要求。这包括但不限于定期审查抓取的数据内容,评估其是否涉及国家秘密、商业秘密或受著作权保护的材料,并检查数据处理方式是否合法合规。例如,企业可以通过日志记录方式来跟踪所有数据抓取活动的细节,包括抓取时间、数据种类、数据来源以及数据的后续使用和处理方式等。通过持续监督数据抓取活动,企业不仅能够及时发现并纠正可能的合规问题,还能够在后续管理过程中不断完善和优化数据抓取策略,从而降低潜在的法律风险,并提升企业的经营效率。

(三)事后管理:响应机制与侵权处理

在采用数据抓取手段获取信息时,企业应注意建立一个有效的反馈机制,以确保能够对权利人的投诉或异议做出及时且有效的响应。企业在数据抓取活动中一旦收到权利人关于侵权的投诉或通知时,应迅速展开调查以核实事实,并根据实际情况采取相应的措施。如果确认存在侵权行为,企业应迅速采取纠正措施,包括但不限于停止数据抓取行为、删除侵权数据等,从而有效地减轻对权利人的侵害,并防止进一步的法律后果。

重要提示:本文章并非提供法律或其他意见,请勿基于本文章内容采取或不采取任何行动。

作者:吴丹君律师团队

首发:微信公众号“大数据法律研究”

版权声明:著作权归作者所有,如需转载,请联系作者获得授权,并注明作者信息及文章出处
发布:吴丹君 编辑:点小读 责任编辑:点小读

还可以输入280个字 查看 《留言评论奖励规则》 发表评论

精选评论

(1)

公司决议下次,股东是否打赏的卡死了肯德基阿里

声音
  • 情感童声
  • 性感男声
  • 特别男声
  • 普通男声
  • 普通女声
语速
  • 0.7X
  • 1.0X
  • 1.5X
  • 2X
  • 3X
  • 4X
字号
  • 特大
  • 标准

作者

吴丹君
  • 文章156
  • 读者52w
  • 关注25
  • 点赞435

  观韬中茂上海办公室合伙人,律商联讯LexisNexis网络安全合规专家、首席数据官联盟专家组成员及法律顾问、深圳市大数据研究与应用协会法律专家。

  专注于互联网、数据信息合规领域,就网络安全和数据信息的合规事项为客户提供咨询及全流程合规整改服务。精耕于网络安全合规领域.

  执业领域:

  互联网|数据信息、兼并收购、外商直接投资、酒店等

  曾为众多跨国公司和外国公司的在华投资、并购以及日常运营提供法律服务。

我也要当作者

思想共享 知识变现

点赞

(1) 更多

常见问题

  • 1、“点读”是什么?

    点读是点睛网APP中的一款全民学法的人工智能(AI)新产品。它能“识字”和“朗读”,它使“读屏”变“听书”,解放读者的眼睛和颈椎。它使“讲课”变“写作”,解放讲师的时间和身心。

  • 2、“点读”的作者?

    在点睛网PC或APP端注册,登录点睛网PC端个人后台,点击“我的文章”,填写作者信息并上传文章。当第一篇文章通过编辑审核后,即成为点睛网的正式作者。

  • 3、“点读”的文章?

    作者在点睛网个人中心发布文章,编辑审核合格的才能呈现给读者。作者只能发布自己写的文章,不能发布或转发他人的文章。更不能发布有违法律法规、政府规定,或公序良俗、文明风尚、社会和谐等文章。

  • 4、“点读”的审核?

    作者文章上传后,编辑将在工作日最晚不超过24个小时、非工作日最晚不超过48个小时内完成审核。审核未通过的,说明理由。文章评论的审核,参照以上周期。

记课时

数据|数据抓取行为的法律风险及合规建议——基于案例和场景的探讨

消费:50点币 现有:0点币 课时:0.35课时/16分钟
确定

您好,以下是重要提示:

本网服务属虚拟电子产品,通过第三方平台支付,退费程序复杂且成本畸高。所以, 一经购买成功,概不支持退费请您理解。谢谢!

支付成功

恭喜您记录课时成功!

继续听课 选择文章
记课时

数据|数据抓取行为的法律风险及合规建议——基于案例和场景的探讨

消费:50点币 现有:0点币(点币余额不足,还需支付533点币) 课时:0.35课时/16分钟
充值

您好,以下是重要提示:

本网服务属虚拟电子产品,通过第三方平台支付,退费程序复杂且成本畸高。所以, 一经购买成功,概不支持退费请您理解。谢谢!

文章查重申诉
0 /1000
提交申诉
提交成功

我们会尽快处理您的申诉意见,
请注意查看处理结果。

确认