为实现弱有所扶,需完善社会救助制度,为社会弱势群体提供社会救助、养老、医疗、失业和社会福利等方面的基本生活保障,最终指向以社会救助权为核心的社会保障体系。

再次,自近现代西方法律理论传入中国,权利自由民权等概念和理论就展现了巨大的感染力,其所蕴含的价值观念逐渐深入中国人的内心,对民众法治意识的形成发挥了重要作用。最后,法治话语使学术研究交流及评价批判得以进行,也只有形成完备而适当的话语体系,才能引导法学思潮、推动中国的法学理论创新,从而取得在世界法学领域的话语权。

周公河竹海

树立主体意识首先要做的就是理性地对待西方理论,西方法治理论由来已久,在漫长的发展历史中形成了较为成熟的体系、价值和概念、方法,其中有很多都具有共通性,可以为我国所用。(三)文化上的张力 中西方的法律文化差异是十分明显的,西方法治话语内含着西方的文化价值及根植于此的制度认同。综上,话语的正当性源于其与人们的文化——包含知识体系、信仰、道德和习俗等所内含的价值相一致,唯有如此才能获得人们内心真正的认同。强制拆迁中开发商认为自己有权对主人没有签订协议的房子强拆,而很多钉子户的目的也是为了拿到合理范围外的赔偿。诚如上文所述,历史证明这一做法是成功的。

{13}社会主义核心价值观便是中华民族的这样一个最大公约数,将其作为社会主义法治话语体系的灵魂,以其为主线进行社会主义法律体系和法律理论的构建,才能尽可能地凝聚西化的法治话语无法凝聚的全社会的法律认同和信仰。我国在三十多年的法律移植进程中常常出现未能深入解读本土国情,却也不能真正透彻地认识西方的情况,当下我们对西方的依赖和信奉……往往是基于忽略了各国不同的历史传统、社会基础、文化背景、民族性格等基础上的某种抽象概念,这就会出现既不真正了解西方、也未能直面中国的‘夹生饭状态{9}。可见,大数据本身为法学实证研究设定了先天的技术门槛。

基于这些大量数据展开的研究,似乎很难视为严格意义上的大数据法律研究。[23]例如,有学者研究了新奥尔良地检署包含145000个被告人的280000起案件,通过机器学习的方法建立了被告人的再犯可能性模型。随着数据来源以惊人的速度扩展,人们会逐渐加深对大数据的依赖,[43]也需要保持对大数据及其相关技术的超脱。[45]欧阳康:《大数据与人文社会科学研究的变革与创新》,《光明日报》2016年11月10日第16版。

[27]机器学习在法学研究中的展开与运用,See Jon Kleinberg, Himabindu Lakkaraju, Jure Leskovec, Jens Ludwig, Sendhil Mullainathan, Human Decisions and Machine Predictions (February 2017).113(1) The Quovterly Tournal of Economics 237-293(2018). [28][英]维克托•迈尔舍恩伯格、肯尼思•库克耶:《大数据时代》,盛杨燕、周涛译,浙江人民出版社2013年版,第94页。二、大数据法律研究中基本问题的澄清 (一)大数据还是大量数据 大数据具备4V(Volume、Velocity、Variety、Value)特征,是关于某一领域(行业)全样本、能够快速流转、多样化且富价值的数据。

周公河竹海

这些技术往往既非传统法律实证研究的方法,也不全是当下分析小数据所运用的统计方法,而是数学与计算机内容交叉、不断发展进化的、以机器学习为主的新型方法。第三,推动研究的团队化与多学科的交叉融合,并致力于培养复合型大数据法学人才。[22]参见倪寿明:《充分挖掘司法大数据的超凡价值》,《人民法院报》2017年6月23日第2版。法律大数据研究的核心在于对海量数据的价值挖掘、处理,这就涉及上述数据的获取、清洗与使用。

从研究对象看,大数据法律研究扩展了法学研究的问题域,使法学研究不再拘泥于传统的研究对象和素材,从而拓展了法学研究的领域和格局。[39]《首个年度大数据产业评估报告发布,将为我国大数据产业健康发展提供有力支撑》,《信息技术与标准化》2017年第9期,第7页。[41]考虑到大数据分析的重要性,必须思考如何在中短期内提升大数据深度分析水平。为了更好地开展大数据法律研究,法学研究者需要通过加强团队建设,特别是加强与计算机科学、软件科学、统计学等相关学科的专业人士以及大数据、人工智能科技公司之间的合作,以更好地应对大数据法律研究带来的机遇与挑战。

[36]关于法律数据尤其是法律大数据如何在法律人工智能中进行运用,可以参见左卫民:《关于法律人工智能在中国运用前景的若干思考》,《清华法学》2018年第2期,第108页以下。在求全不得的条件下,如果能够正确清洗数据,正确把握数据缺失的程度、特别是有无系统性缺失,大量数据就具有不可替代的学术研究价值。

周公河竹海

这样的伦理问题目前似乎并未引起研究者的注意,对此更应有意识地采取相应的技术处理策略。在目前的大数据法律研究领域,数据挖掘依然主要通过正则表达式的方式。

根据全国法院2014年和2015年的裁判文书上网统计显示:按省份看,上网裁判文书占实际结案文书比重最高的达78.14%(陕西),最低的仅为15.17%(西藏)。但总体而言,目前国内对于法律大数据的实践性运用还相对有限,具体运用并不普遍,在一定程度上呈现出话语热、实践冷的现象:一方面,应用主体范围有限,主要集中在少数司法机关、法律数据公司。这可能会使研究者陷入过分关注技术分析,忽视创新思维和思辨分析[29]的窠臼中。因此,检视大数据法律研究现状,澄清若干误识,对于大数据法律研究的健康开展具有基础性意义。裁判文书的上网公开有望更具规范性。这或许也是很多实证研究者依然致力于小数据研究的重要原因。

[16]其中,裁判文书大规模上网,使得中国第一次有了全国性、公开的、细节化的法律数据。数据的官方化,是法律大数据不同于商业性、社会性数据的特殊之处,这就决定了法律大数据的获取与应用水平在相当程度上取决于法律机构是否充分、及时公开其收集、掌握的法律信息。

[48]参见前引[35],刘鹏主编书,第35页。[36]为此,首先要拓宽法律大数据的领域。

第二,努力扩展法律数据的来源。就此而言,面向未来的大数据法律研究复合型人才培养极为重要。

检察机关虽然公布了部分诉讼文书,但存在数量少、不全面以及可获得性较差等问题。由于爬虫软件抓取的文书是典型的无标签非结构化数据,其中包含重复文书、空白文书等脏数据,此时就必须借助数据清洗手段处理这些文书,添加案号、案由、审级等常规标签。顾理平:《大数据时代公民隐私数据的收集与处置》,《中州学刊》2017年第9期,第161页以下。虽然2016年最高人民法院修订了《关于人民法院在互联网公布裁判文书的规定》(法释[2016]19号),但由于其约束力不强、操作性较弱,事实上并未实现(除不予公布的)其他裁判文书一律在互联网公布[33]的目标。

法律大数据已大量应用于司法管理活动和程序性司法决策。数据是大数据法律研究展开的基础,只有具备足够的数据源才可以挖掘出数据背后的价值。

如何认识大量数据的学术研究价值?一方面,完美的法律大数据往往难以强求。[28]目前有关大数据的法律研究,在研究取向上偏重于实践型、应用型,而非学理性、抽象性,侧重数据的调查与描述,过度沉迷于让数据自己说话甚至自己思考,疏于开展深度的理论剖析与建构。

数据分析的速度越来越快,经常在数据刚刚敲进去的时候就可以看到实时的分析结果,[1]这有助于研究者及时有效地掌握相关法律实践状况的全貌,从而克服传统实证研究方法耗时、滞后的缺陷。第四,长期以来,基于小数据的法律实证研究一直是主流研究方式,有其重大学术价值。

在大数据法律研究及相关人工智能应用研究中,无论是数据的收集、整理,还是其分析、运用,都需要研究者具有多学科的知识与经验,如数据挖掘就涉及数据库技术、机器学习、模式识别、知识库工程、神经网络、数理统计、信息的可视化等众多领域,[48]知识结构单一的研究者甚至研究团队,往往难以应对。此外,上网裁判文书所涉及的案件类型并不全面,特别是一些重大职务犯罪类案件,其裁判文书往往并不上网。[47]参见前引[29],孙建军文。[20]根据四川省高级人民法院的工作报告,四川法院2012-2016年间年审执结案件总量分别为685300件、738857件、750254件、821285件、869429件,五年合计3865125件。

[3]参见刘佳奇:《论大数据时代法律实效研究范式之变革》,《湖北社会科学》2015年第7期,第143页。[30]参见孙秀林、陈华珊:《互联网与社会学定量研究》,《中国社会科学》2016年第7期,第119页。

因此,大数据法律研究应该回应智慧司法智慧检察的实践需要,并藉此获得更大的致用空间,在理论与实践的互动过程中形成问题意识,推进大数据法律研究的发展。未来的大数据法律研究不仅应思考如何更好地获取法律大数据,还要探讨如何正确认识与适当使用大量数据,更要充分利用统计方法展开大数据法律研究,探讨如何科学使用机器学习等新方式分析法律大数据。

另一方面,大数据法律研究也应该直面一些传统的法学理论命题,借助法律大数据分析工具对其进行检验或创新发展。例如,对于通过数据关联分析在大量散乱的数据中如何发现数据之间的相关性,并将这些数据形成一个数据集,从而描绘出某个事物或事件的发展规律或趋势,传统的统计学方法往往力不从心,需要通过机器学习实现研究目标。

文章发布:2025-04-05 20:10:12

本文链接: http://1g2wp.onlinekreditetestsiegergerade.org/83596/4406.html