业务办理时间

周一至周五

09:00-11:30

14:00-17:30

在岗情况
投诉举报
电话
400-086-9797
技术支持
当前位置: 首页 >> 业务研究 >> 研究动态
周连勇 蔡芸琪:网络爬虫侵害政务数据的刑法规制路径研究
日期:2023-01-06    阅读:1,602次


摘   要:互联网飞速发展的当下,数据已成为承载海量信息的重要资源。而随之引发的针对数据的爬虫类不法行为已经成为刑法规制的重点。但在政务数据的语境下,由于开放、共享、透明的原则限制,似乎一度让其成为爬虫技术活跃的免责空间。但问题在于,一方面,从整体安全观的角度出发,政务数据并非可以全面开放共享;另一方面,从微观利用权限的角度出发,政务数据本身也兼具多种法益属性。因此,考虑现有实践规范的不足,可以考虑从厘清复合法益、关注国家社会安全、扩大个人信息范围等多个方面,更为全面客观地对网络爬虫侵害政务数据的不法行为进行有效的规制评价。关键词:政务数据  爬虫技术  复合法益  刑法规制


问题的提出


2020年,我国数字经济总量跃居世界第二,成为引领全球数字经济创新的重要策源地(注释1)。2022年,习近平总书记在中央政治局第三十四次集体学习时指出:“要推动数字经济和实体经济融合发展,把握数字化、网络化、智能化方向。” 事实上,数字经济的飞速发展已然构建了网络空间与物理空间并行的双维世界,也让依托互联网存在的承载诸多信息内容的数据被赋予了无与伦比的价值与作用。简言之,数据应用的重要性不言而喻。而这其中,作为新技术与新应用的典型代表,网络爬虫技术及其商业化应用,成为网络空间中数据资源的重要获取方式(注释2)。

网络爬虫,又称“网络蜘蛛”,是一项互联网信息搜集技术。其主要工作步骤包括网页获取、网页解析、数据存储、主题判别、网页搜索策略(注释3)。事实上,爬虫技术的应用由来已久,一般分为“通用爬虫”与“主题爬虫”两大类,前者主要应用在搜索引擎,而后者则主要针对特定主题或单一网站进行数据爬取,而争议也由此而来。

应当认为,爬虫技术本身是一种中立性质的搜索技术,可以在海量的数据中,通过智能化的指令程序轻易搜索到用户需要的关键信息,充分满足互联网上日益增多的网络资源和信息需求。但技术的用途往往受限于使用主体,不同主体或为逐利、或因私欲对爬虫技术进行了无底线的拓展滥用,越过中立使用的合法边界,对公民个人甚至国家社会的合法权益造成侵扰,那就理应受到相应规制。

事实上,现有司法实践对滥用爬虫技术的严厉规制并非空白,早在“史上最大规模用户数据窃取案”(注释4)的宣判,对爬虫技术的限制就不仅仅局限在技术层面,而已经被纳入法律框架下进行严格审视。但这样的严格尺度,在针对政务数据的爬虫规制方面却显得相对缺失。

依据《数据安全法》的相关规定,国家机关应当遵循公正、公平、便民的原则,按照规定及时、准确地公开政务数据。依法不予公开的除外。因此,理论界往往认为,为充分推动经济社会发展、公民权利保障,可以充分放开对政务数据的利用与获取。在满足个人信息保护的前提下,基于公共数据的“聚、通、用”特征和政府的信息公开义务,个人或企业可在政务数据开放范围内自由与平等地对作为公共资源提供的政务数据加以获取和使用(注释5)。对政务数据的爬虫分享往往也被放置于更为宽松的审视环境下。

但事实上,政务平台因其平台主体及工作职责的特殊性,其本身同样汇聚了海量关键、核心数据,事关国家社会发展、公民人身安全。2022年《国务院关于数字经济发展情况的报告》明确,持续提升数字公共服务水平。要求推动政务信息化共建共用,持续提高“互联网+政务服务”效能。换言之,互联网政务服务平台的建设与发展已经是大势所趋,但随之而来,政务部门关键信息的数据化数量也必然与日俱增。因此,若一概将政务数据分放在开放共享、利用免责的“真空”区间内,数据泄露等安全问题显然会接踵而至,极易造成国家社会安全的极大隐患,需要谨慎讨论对待。


政务数据权属 应用的规范界定


根据《数据安全法》第三十八条的相关规定,政务数据是指国家机关为履行法定职责收集和使用的数据。理论界往往认为,不同于企业数据的优化加工,政务数据往往都是简单粗放式地将收集数据直接公开,不涉及产权保护,也更不涉非法采集。但事实上,政务数据根据不同的使用主体,不同的制作类型,往往也涉及不同的保护等级、使用权限。

(一)政务数据开放共享的类型与限制

1、政务数据开放共享的不同类型

第一,政府内部的信息共享

2015年10月,党的十八届五中全会明确提出“实施国家大数据战略,推进数据资源开放共享”。同月,《中共中央关于制定国民经济和社会发展第十三个五年规划的建议》首次把“推进数据资源开放共享”上升为“国家大数据战略”的组成部分。2016年9月,国务院印发《政务信息资源共享管理暂行办法》,明确对政务信息分类与共享作出具体要求。2021年3月,“十四五”规划和2035年远景目标纲要提出“推动政务信息化共建共用,提升跨部门协同治理能力”,进一步明确部门内部共享信息的政策规划。

概言之,近几年来,国家从政策及法律规范等多个层面上明确规定了政务信息共享的原则以及相应的细化办法。一方面,让政务信息资源在各部门间有序流动,方便了政务部门之间的工作对接;另一方面,对包括人口信息、电子证照等在内的信息进行了共享,也简化了民众办理业务的程序步骤。

第二,社会公众的信息公开

十八大以来,反腐工作紧锣密鼓、有序推进,公众的日常监督实际也是反腐倡廉工作的重要一环。换言之,信息共享不能仅仅停留在部门内部,对公众的开放也是应有之义。

2015年《促进大数据发展行动纲要》明确提出“推进数据资源向社会开放,增强政府公信力,引导社会发展,服务公众企业”。要求“优先推动信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放”。2018年1月,中央网信办、国家发改委、工信部联合印发《公共信息资源开放试点工作方案》,确定在北京、上海、浙江、福建、贵州开展公共信息资源开放试点工作。根据该方案,试点工作重点开放信用服务、医疗卫生、社保就业、公共安全、城建住房、交通运输、教育文化、科技创新、资源能源、生态环境等领域的公共信息资源。

概言之,通过脱敏脱密等加工处理后,可以将政务信息开放给个人、企业,保障民众的日常监督权与知情权。积极提升相关数据的实用价值,避免数据的闲置造成对资源信息的浪费。

2、政务数据开放共享的必要限制

从信息安全的角度来看,部分政务数据牵涉到国计民生的关键领域。当今世界格局风云变幻,我国仍旧处于发展的关键时期,意识形态、经济发展等方面的冲突争论仍在。因此,数据的开放与共享本就需要谨小慎微,避免有心人的无端获取利用。一旦完全放开,不仅是为国人所知,也更易为外邦所获。相关数据的泄漏可能对经济社会、国家安全等造成威胁,进而损害国家及国人根本利益。

因此,且不论部门间的信息流转,针对社会公众的数据开放过程,本就应当遵循分期、分批的步骤原则。一般来说,针对不敏感、非涉密的政务数据,可以先行开放,完善大数据监督和技术反腐体系;而针对敏感、涉密的政务数据,应当进行脱敏脱密处理,保证数据的开放共享不能提供相关人员挖掘分析的途径,以致侵害到个人隐私、甚至是国家安全。

可以看到,或是因为部门间特定领域的合作互通、或是为特定事务的透明监督,政务数据正在逐步进行开放共享,但考虑到政务部门所采集信息的特殊性质,在事关国家安全、社会安全的关键领域,政务信息并非是无节制放开的,这一点也为爬虫数据的应用划定了红线。

(二)政务部门对数据使用的具体权限

如上所述,依据《数据安全法》的相关规定,政务部门依照各部门的职责要求在履职过程中进行数据采集。换言之,各政务主体拥有职责范围内的信息采集权。但采集权之外,政务部门对政务数据是否具有所有权权益、是否存在挖掘分析的利用途径,则需要进一步分析。

1、政务数据的权益归属

事实上,政务部门是否具有政务数据的所有权,目前理论界并无定论(注释6)。有观点认为,政务数据归属于国家所有。例如《福建省政务数据管理办法》第三条规定,政务数据资源属于国家所有,纳入国有资产管理。《西安市政务数据资源共享管理办法》第七条规定,政务数据资源所有权归国家,属于国有资产管理范畴。也有观点认为,政务数据归属政府所有。例如《广东省政务数据资源共享管理办法(试行)》第四条规定,政务数据资源所有权归政府所有。

但无论哪种观点,可以确定的是,政务数据之上同样存在所有权的权利类型,也即,有值得保护的财产价值属性。

2、政务数据的挖掘使用

首先,为保证数据公开的合法,政务数据必要时应当进行脱敏脱密。实践中,政务部门委托专业机构对政务信息隐匿处理的做法非常常见。即使尚未改变数据的功能属性,但脱敏脱密的过程也仍旧属于对数据的深化加工,赋予数据可对外开放的利用价值。

其次,政务数据的深度挖掘。为方便群众办事、提高政务效率,政务主体往往会自行或委托专业机构对采集到的原始数据进行整合利用,以政务合作或公众需求为导向进行有效分析挖掘。例如,贵州省民政厅试点智能分析库。根据婚姻状态,聚焦已婚人群、离异人群两大对象,从时间、空间、关联、预约信息、载体五维度交叉比对、关联关系挖掘等方法进行数据汇总,处理分析全省的婚姻现状、婚姻预约登记情况,进而实时反映全省婚姻的总体情况。

概言之,政务部门对政务数据并非仅仅只有采集管理的一种权限,在政务对接、公众需求等多种因素的影响下,政务部门往往会对政务数据进行多种发掘使用。如此,尽管政务部门属于国家公权力机关,行使公益性质的国家职权,但也应当承认其对相关政务数据的有效权利,避免互联网爬虫技术的无底线侵害。


刑法参与爬虫侵害 的基本规制模式


具体看,现行刑法已然对爬虫技术的滥用进行了相应的规制与处理。一般来说,主要依据爬虫技术的不同行为表现,对其进行刑法规制。

(一)现有的司法规制路径模式

依据相关统计,现行司法实践中,针对网络爬虫的刑法规制主要集中在以下几类罪名中:侵犯公民个人信息罪、非法获取计算机信息系统数据罪、侵犯著作权罪、传播淫秽物品牟利罪、提供侵入、非法控制计算机信息系统程序、工具罪等(注释7)。具体来看:

首先,针对网络爬虫本身的技术手段,重点着眼于爬虫技术的先行访问行为。一方面,高频次的访问可能超出平台服务器的承载范围,造成相关数据平台的崩溃瘫痪;另一方面,爬虫技术为获取核心数据往往恶意绕开平台保密措施进行非法访问。依据《刑法》第二百八十五条的相关规定,其侵入和破坏计算机信息系统的干扰行为可能构成“非法侵入计算机信息系统罪”。

其次,针对网络爬虫侵害的数据内容。主要关注爬虫技术从计算机系统获取的数据性质。刑法将数据类型化、具体化为诸多种类,通过不同数据对象的关联罪名适用实现对特定法益的保护(注释8)。而直接针对爬虫技术获取的数字内容进行规制的情况,则一般表现为是对公民个人信息的保护。侵犯公民个人信息罪作为实践中规制爬虫行为的主要罪名,关注的并不仅仅是姓名、身份证件号码等单一识别性的数据,同样包括通过住址、账号密码、财产状况、行踪轨迹等综合分析确认公民身份的交叉识别性的数据。获取平台内部存储的上述公民信息,依据《刑法》第二百五十三条之一第三款的规定,可能构成侵犯公民个人信息罪。

最后,针对爬虫技术爬取数据的后续使用。爬取数据后不恰当的使用方式,也是刑法规制关注的重点。在具体场景下对相应的后续处理行为进行类型化判断,并与刑法分则具体罪名加以对比并定性。所涉罪名一般包括侵犯商业秘密罪、侵犯著作权罪、侵犯公民个人信息罪、传播淫秽物品罪等。

(二)现有规制路径中的缺陷与问题

纵观现有的司法规制案例,除爬虫技术最初的侵入访问行为之外,司法实践更多是结合数据的相关法益属性,进行规范上的参照评价。但随之而来的问题是,一直以来,理论界对政务数据之上的相关属性存在相当的忽视与误解,如此也导致了对政务数据保护的遗漏与空白。

第一,未能有效重视政务数据的财产属性。

如上述,政务数据之上同样存在所有权性质,归属于国家或政府。也即,相关主体对采集到的政务数据依法享有、使用、收益和处分的权利。换言之,政务数据本身也具有法定的财产属性。政府数据的财产权归属规则是指政府原始数据或者一手数据的持有者对该数据进行再次优化或者整合,该部分数据的权利归属于谁的规则。政府数据财产权归属可以实现正义的二次分配功能(注释9)。一方面是原始的采集数据,另一方面是不断优化分析利用的加工数据,两者均有助于数字政府、服务政府的相应工作建设,也同样具有值得保护的财产利益。因此,不应忽视爬虫技术导致的财产权益侵害。

第二,未能正确把握政务数据的知识产权属性。

随着知识产权保护法益的不断调整,新型的权利客体也涌现出来,比如由传统的只保护纸质版的作品等扩展到声音、气味等(注释10)。政务数据亦是如此。事实上,通过对数据的深度挖掘、充分利用,政务数据之上承载的权益内容也在变化、增加。因此,以“独创性”为识别原则,政务部门在对采集到的一次数据进行深度挖掘分析所产生的二次数据若具有相应的独创性也应当成为知识产权规范所保护的对象。

第三,未能扩大保护政务数据的核心安全法益。

在信息时代,国家不仅仅是信息治理者,也是重要的个人信息获取、加工、利用者(注释11)。2017年《网络安全法》强调保障网络安全,维护网络空间主权和国家安全、社会公共利益。新修订《国家安全法》第二十五条规定,国家建设网络与信息安全保障体系,明确维护,维护国家网络空间主权、安全和发展利益。网络数据之上实际承载诸多国家、社会利益,关系到总体国家安全。

2022年7月21日,国家互联网信息办公室依据《网络安全法》等法律法规,对滴滴全球股份有限公司处人民币80.26亿元罚款,对滴滴全球股份有限公司董事长兼CEO程维、总裁柳青各处人民币100万元罚款,引发公众关注。简言之,仅仅企业数据都能通过海量数据的采集、分析、利用对国家安全构成重大威胁,更遑论本就承载重大核心内容的政务数据。但现有规制路径中却鲜有针对国家安全法益类型的罪名。


网络爬虫刑法规制 模式的完善路径


(一)厘清爬虫侵害政务数据的复合法益

首先需要对政务数据所包含的不同法益属性进行区分,以明确其在刑法各章节的适用场景,从而更为全面充分地对政务数据进行保护。

由于爬虫技术侵害政务数据的案例较少,且以一般企业数据被侵害案件为例,现行刑法对于企业数据的规制范围往往集中在破坏社会主义市场经济秩序中知识产权类、侵犯公民人身权利、民主权利类以及妨害社会管理秩序中扰乱公共秩序类的章节中。但观察各“爬虫”类犯罪案例可以发现,受限于爬虫技术本身包含的多步骤多内容,从行为本身到获取对象再到后续使用,均可能触犯一定的刑法规范。换言之,同时兼具“行为不法”以及“对象不法”的情况并不在少数。司法实践中,或是仅仅关注对数据本身及背后计算机系统的危害,或是单纯强调对数据之上所包含权利的侵害(注释12),导致对滥用爬虫技术的规制往往呈现出一定的随意性或者说是不确定性,对爬虫侵害法益的评价标准并非统一明确。

因此,一方面需要厘清不同政务数据中蕴含的复合法益。具体来说,政务数据中包含的法益包括总体法益和部分法益。总体法益即是指从总体国家、社会利益角度出发,具体包括社会秩序、公共利益和国家安全;部分法益则是从公民、企业、社会组织等出发,具体包括个人人身、财产权利等。如前述,政务数据之上实际兼具总体法益与部分法益,需要全面评价、谨慎对待。另一方面需要从实质性违法的角度判断。抛弃对单纯客观行为形式违法的判断,转而重点关注行为实质侵害对象,从爬虫技术所侵害的法益入手进行刑事评价。避免对“非法侵入计算机信息系统罪”的反复兜底适用(注释13),尽量做到罪名评价的精确化、统一化。

(二)加强“国家安全”“公共安全”类的法益保护

2015年12月,在第二届世界互联网大会上,习近平总书记提出“网络安全是全球性挑战,没有哪个国家能够置身事外、独善其身,维护网络安全是国际社会的共同责任。”并主张全球互联网治理体系变革的“四项原则”、构建网络空间命运共同体的“五点主张”,明确将网络空间主权、网络安全提高到了国家主权和人类命运共同体的高度。2018年4月,在全国网络安全和信息化工作会议上,总书记再次强调,“没有网络安全就没有国家安全,就没有经济社会稳定运行,广大人民群众利益也难以得到保障。”

应当说,在国家总体政策精神的指导下,对网络安全以及数据安全的保护已经体现在相关立法规范上,包括《数据安全法》的出台以及《国家安全法》的最新修订,都体现了对互联网行为中国家安全的紧密关注。但问题在于,行政与民事条文之外,刑事作为规范处置的最后一道防线,却并未与时俱进地将侵害活动有效容纳到相应的评价体系中。

依据《刑法》第一百零二至一百一十三条的相关规定,以“危害国家安全罪”类型为例,事实上,现行规范中并没有用类型条款可以综合涵盖爬虫技术侵害国家安全的不法行为。例如《刑法》第一百一十一条有规定“为境外窃取、刺探、收买、非法提供国家秘密罪”,但问题在于,国家秘密的定义范围实际较为狭窄(注释14),并不能完全涵盖具有重要分析利用价值的政务数据。

同样的,以上述“滴滴事件”为例,公民的行程信息、城市的道路信息等并非是“国家秘密”的界定范围,但在不断的加工整合利用之下,同样会对国家安全造成极大损害。相关信息向境外的打包传递,已经远远脱离普通商业行为,应当被纳入到危害国家安全的刑事不法中进行考量。

因此,可以依据《国家安全法》《网络安全法》等现有政策精神及规范内容,及时对刑法规范进行适当的补充调整。对爬虫技术侵害国家安全、公共安全的相关行为进行必要规制。例如在《刑法》分则第一章危害国家安全罪类型中,将前述一百一十一条修改为“为境外窃取、刺探、收买、非法提供国家数据、情报罪”以扩大数据信息的保护范围。在分则第二章危害公共安全罪类型中,其第一百一十四、一百一十五条规定了以危险方法危害公共安全罪,但相较于放火、决水等危险方法,非法获取数据的行为类型显然难以扩大解释到上述危险方法中,建议在司法解释中将“非法获取数据危害公共安全的行为”加以明确列举,抑或是直接增设“非法获取电子数据罪”。

(三)扩大政务数据中个人信息的保护范围

依据《网络安全法》第七十六条第(五)项的规定,个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息,包括但不限于自然人的姓名、出生日期、证件号码等。其虽对个人信息进行了明确列举式的解释,但也并没有完全涵盖个人信息中的全部内容,如网购交易记录、网页浏览痕迹、导航路线记录等,有人称之为“数位足迹”(注释15)。尽管从信息可识别性上看,上述记录等并不如家庭住址、电话号码等与个人特征紧密相连,但通过零碎数据的深度分析,往往也能够大概涵盖识别公民个人。当然,以上仍旧是从对公民个人的“可识别性”上进行判断,但即使目的不是识别个人,海量的公民个人信息也关系着国家社会安全。

有学者也认为大数据的内容可以做匿名化处理,匿名化后的数据同样具有商业价值,与原有的个人数据已然不同(注释16)。那么,具体到政务数据来看,匿名化后的个人数据实际仍旧具备相当的安全保卫价值。因此,在侵害到特殊领域时,有必要将刑事规范中关于个人信息的范围适当扩大。举例来说,新冠肺炎疫情期间,大家日常使用和关注的疫苗接种信息、健康码信息以及核酸检测信息,即使在匿名化处置之后不一定能够精准定位到个人,但上述数据具备重要的生物、卫生信息,同样关系到国计民生。概言之,规范内容及时跟进时代变化,避免科学技术发展迅速而导致对部分权益的保护缺失,保证司法实践有法可依、用法明确。

注   释:

1、参见《国家互联网信息办公室发布〈数字中国发展报告(2020年)》,载中国政府网2021年7月3日, http://www.gov.cn/xinwen/2021-07/03/content_5622668.htm 2、苗运卫,程关松:《恶意网络爬虫行为侵害企业数据的刑法规制》,载《法治论坛》2021年第2期。 3、潘晓英,陈柳,余慧敏:《主题爬虫技术研究综述》,载《计算机应用研究》2020年第4期。 4、案涉瑞智华胜公司通过与网络运营商签订营销广告系统服务合同,非法从运营商流量池中窃取30亿网络数据进而登入上亿用户的社交账号进行微博、微信、QQ、抖音等社交平台的加粉、加群、非法获利。 5、苗运卫,程关松:《恶意网络爬虫行为侵害企业数据的刑法规制》,载《法治论坛》2021年第2期。 6、参见卢荣婕:《政府数据的权属确认》,载《太原理工大学学报(社会科学版)》2022年第6期。 7、刘浩:《网络“爬虫”行为刑事规制的困境与转向》,载《西安电子科技大学学报(社会科学版)》2022年第2期。 8、刘浩:《网络“爬虫”行为刑事规制的困境与转向》,载《西安电子科技大学学报(社会科学版)》2022年第2期。 9、龙卫球:《数据新型财产权构建及其体系研究》,载《政法论坛》2017年第4期。 10、吴汉东:《无形财产权基本问题研究》,中国人民大学出版社2013年版,第8页。 11、张新宝:《从隐私到个人信息:利益再衡量的理论与制度安排》,载《中国法学》2015年第3期。 12、参见孙杰:《数据爬取的刑法规制》,载《政法论丛》2021年第3期。 13、参照刘浩:《网络“爬虫”行为刑事规制的困境与转向》,载《西安电子科技大学学报(社会科学版)》2022年第2期。 14、依据《保守国家秘密法》第二条:“国家秘密是关系国家安全和利益,依照法定程序确定,在一定时间内只限一定范围的人员知悉的事项。” 15、参见杨楠:《个人数位足迹刑法规制的功能性偏误与修正》,载《安徽大学学报(哲学社会科学版)》2019年第4期。 16、李晓阳:《大数据背景下商业数据的财产性》,载《江苏社会科学》2019年第5期。 

                             




周连勇:江苏博事达律师事务所主任,一级律师;南京市律师协会副会长。江苏省委政法委法律专家库成员、东南大学、南京审计大学等高校兼职导师。主编《成功的辩护》、《疑案的研判》等;参与制定省律师协会《辩护律师办理刑事案件非法证据排除指引》;与东南大学共建“企业高管犯罪预防与控制研究中心”,全国优秀法律顾问。


蔡芸琪:江苏博事达律师事务所专职律师,苏州大学刑法学硕士,江苏省法学会教育法学研究会理事,中欧跨境法律服务综合平台中方联络员,东南大学“企业高管犯罪预防与控制研究中心”助理研究员,曾发表《“专断医疗”行为的正当化根据及其限制》、《技术规范在人工智能刑法规制中的引入》等文章,并参与编写《国家监察学原理》一书。


*附件列表(点击下载)








    南京市律师协会微信公众账号