您当前所在位置：首页 > 各研究会 > 诉讼法学 > 正文

刘哲：司法大数据九章

来源：|发布时间：2022-07-12 11:50:19|浏览次数：

刘哲 | 北京市人民检察院首批入额检察官

曾办理山西溃坝案，设计并组织研发刑事公诉出庭能力培养平台。著有：《你办的不是案子，而是别人的人生》《检察再出发》《法治无禁区》《司法观》《法律职业的选择》《司法的长期主义》《司法的趋势》。有纯原创公众号“刘哲说法”。

感谢刘哲检察官赠书，这八篇文章和一个演讲视频来自刘检察官的公众号“刘哲说法”，总题为本号编者所加。

第一章：关于司法大数据

第二章：大数据检察其实是一种思维方式

第三章：检察大数据模型

第四章：检察大数据远在天边近在眼前

第五章：大数据思维首先是领导思维，其次才是办案思维

第六章：滚雪球算法与监督矿脉的大数据探查

第七章 | 出庭大数据和算法分析之一：有时候大数据是个副产品

第八章：大数据怎么自己动起来？

第九章：出庭大数据——公诉人进化论（刘哲演讲视频）

第一章：关于司法大数据

前些年，司法信息化强调的是“智慧”，现在更多的是强调“大数据”。

强调“智慧”，是希望通过一些软件能够尽量的替代人，自动撰写审查报告、自动生成法律文书、自动提出量刑意见、自动提出处理意见，好像这些几乎都可以把人替代得差不多了。

但事实上，不仅没有替代人，反而把人搞得更累了，自动填充的案卡，你要不校对就经常有错误，最后责任还是在你自己。而所谓自动生成文书报告之类，完全是脱离了科技发展水平，也严重低估了司法工作的复杂程度，成为天方夜谭。

现在不是“智慧”，不少系统成为枷锁和负担。

在司法领域通过智能软件想要替代人还远得很，很多负责人认识到这个问题，所以就不再提什么“智慧”了，而是要提一些更实际一点的功能。

因此才有“大数据”的提法，应该说“大数据”是“智慧”之后退而求次的产物。

因此“智慧”本身就必然包含“大数据”的内容，因为机器学习的前提就是大量的数据啊，如果没有数据的支持还谈什么智慧呢。

因此“大数据”其实是“智慧”的基础，或者说是“智慧”的初级阶段。

现在“智慧”回到“大数据”就是回到最基础的层面来考虑问题，因此也可以说这是一种更加务实的表现。

但其实想要真正弄通“大数据”也并不容易。

因为“大数据”并不仅仅是大量数据的问题，其有一个数据融合、数据整理、数据利用的问题。

所谓数据融合就是要打通数据壁垒。现在司法机关掌握的数据不能说不多，不能说这个数据库不够大。但问题是每一个司法系统就把数据当作资源和权力绝不会轻易分享。

这种说法确实认识到数据的重要性，但这种条块分割的方式，让数据支离破碎，每个系统的数据都是不完整的，都不能反映案件的全貌，因此数据的价值也必然打了打了折扣。

事实上，数据的条块风格并不仅限于司法系统之间，即使是一个司法机关内部，也存在多个系统，而数据并不联通的问题，并不仅是在填录上要造成重复劳动，最重要的是不能有效利用很多重要的数据信息。

有些政法机关甚至存在几十个信息系统，而每一个都是由一个特定部门来管理，每一个系统都作为特定部门的特定权力，即使在一个机关内部也是不愿意分享的，因为一旦分享这个特定的权力就没有了。

因此数据融合看起来是融合数据，其实融合的权力和管理，数据的融合实际上是不同之间权力的真正配合，管理上的有效协同。

数据系统看起来是非常基础的工作，但是由于系统的刚性、稳定性和持续性，一旦数据融合完毕，其实不同权力之间就会实现一种自动打通，不再需要一事一议的沟通和协调，这样一来权力感就会下降，一些负责人也会因为没有人找而找不到感觉，这也是从内心深处不愿意让数据系统打通的原因。

还有的不同部门之间和单位之间是存在一些监督制约关系的，一旦打通数据系统就意味着把自己的底牌时时暴露给对方，对方随时都可能从这些海量的数据之中窥探到自己的问题，这就相当于将自己的司法行为置于其他监督方的眼皮子底下。

对于很多害怕监督，对自己的办案治理和规范化程度的单位和部门来说，他们是没有信心的。

担心大权旁落，害怕质量受到随时监管，这就是司法数据整合的最大难题。

而没有数据的整合，目前看起来很大的数据，其实只是一片片数据孤岛，是难以形成司法数据网络的，而没有形成网络的司法数据，虽然很大，但也不是真正的意义上的大数据。

真正的大数据首先需要对这些海量而杂乱的数据内容进行充分的加工和整理。

这种加工和整理并不是要篡改数据，而是通过数据之间关联和确认，形成一个数据有机体，再通过特有的逻辑，将数据进行分类的整理。

经过分类整理的数据才显得更加有价值，也更加能够识别出数据背后的一些规律。

这些规律是通过不断的数据整理才能够发现的，而这些规律才是司法大数据最有含金量的地方。

比如量刑数据的整理就是如此，只有对一类案件量刑数据积累的足够多才能够探查出相关的规律，但这种量刑的规律不仅与案件的具体事实和情节有关系，还与具体的地域和审判机关有关系，与具体的审判长都有一定的关系。

这些数据只有通过这些关系串联起来，才会变得更加清楚。

样本少了不行，不科学的搭配和整合也是什么也看不明白的。

整理好的数据还要看怎么用。

比如案例就是一种很好的数据整理成果。一个案例是没有意义的，它只有让更多的人知悉才有意义。

目前的指导案例和典型案例就能够起到一定的示范作用。

可惜的是这种案例太少了，而司法实践在丰富了，很多时候指导不过来。

很多实践中发生的情况，指导案例和典型案例都没有，如果等着出新的案例来指导，周期太长了。

而且指导案例和典型案例的发布也缺少必要的规律，也不知道什么时候能出一批，出这一批打来什么类似，其他的情况又改怎么办。

这是一种海量的案例需求与极少量的案例发布之间的矛盾。

而且目前的案例发布也非常分散，除了两高的案例，各个省发布的案例其他的省份也很难看见，想要借鉴根本不知道向哪里问。

其实很多省级市级的案例不仅对自己所在地区有用，对其他地区也有参考借鉴意义。

而且如果有些地区有了类似的案例，其他地区也没有过多的进行重复建设，可以考虑在一些人无我有的案例上下功夫，这样可以从总的层面丰富案例库的丰富度。

但目前还没有形成全国系统案例库的充分整合，除了两高的案例，其他案例都处于各自为战的状态。

而各自为战的结果就是每个地区都要一套各种类型的案例才行，但是由于案件类型分布的不均匀，在有些司空见惯的案件，在很多地方就是新型案件，当办理这种新型案件的时候最希望能够看到一些类似的案例，即使是外省市的也有借鉴意义啊。

但是在考虑案例库的时候往往有一种倾向，就是只考虑两高而不考虑地方案例，总是有一种地方案例没有价值的错误认识。

事实上，地方案例未必没有两高案例的质量高，只是由于一些机缘巧合的原因，没有成为两高案例而已，但其所蕴含的价值可能却是普遍的，对于个别地区甚至是急需的。

将那些办理一类案件比较成熟地区的案例分享给此类案件见的比较少的地区，实际上就是一种经验传播和司法标准的引导，是极为有价值的事情。

这种价值的分享只有建立全国统一的案例库，并能够海纳百川的吸收全国各地的案例才能够实现。

就像只要商品足够丰富的购物平台才能够吸收最大多数的顾客一样，只有汇集最多种类最多数量的案例库，才能让更多的司法人员所信赖，才能在任何困难的情况都能够想到在这个案例库来找一找。

不仅仅是高精尖的产品支撑了淘宝、京东这样的购物平台，万能宝库一样的品类大全，才能让用户有很多的选择余地，也让他们相信一定能够找到点什么东西，也只有这样才能形成使用习惯。

而此时的大数据才是有用的大数据，真正的大数据。

第二章：大数据检察其实是一种思维方式

大数据在司法领域，尤其是在检察领域是一个热词。

但是现在有两种观念，一种是望而却步，另一种是不以为然。

望而却步者认为这是一种高科技，是检察信息化的高级阶段，一定要建立很多系统吧，太复杂、太麻烦，成本高，玩不了。

另一种不以为然认为这是一种花把式，故弄玄虚，徒有其名，认为对办案帮助不大，至少是对日常办案没有太多实质的影响。

这两种都对大数据都有一定程度的误解，但这种误解有一定程度的道理，而且带有一定程度的普遍性。

望而却步的，认为大数据就要花大钱建系统的，都是被信息化这几年弄的有点思维定式，就是认为一定要建一个系统来，才能鼓捣这些大数据，不建就弄不了大数据，将大数据和信息化系统划等号了。

其实这是不对的，因为大数据其实是一种应用，只要有了一定量的数据，就可以用一些通用的数据分析工具，就可以进行分析。有些分析工具就是像excel表这样的分析工具，本质上就是一些数据库。

当然了还有一些更高级的分析工具，但这些都没有什么太大的投入，因为这些分析工具软件都是通用版本，即使购买也非常低廉。

原来的所谓系统，往往是定制的，是专门为你量身定做的，而且很有可能是只有你有需求，而其他单位没有需求。

这样一来成本就很高，因为软件公司不能重复销售，这样成本就会非常高。

而如果系统是通用的，就比如复杂如操作系统，只要它的销售量足够大，它的成本也会变得极低，从而让普通用户都能够使用。

而一些简单的数据分析，其实这些日常的分析工具就已经够用，只有超大型数据量的时候，才需要使用复杂一些的数据库工具。

因此，大数据在办案中的应用不用专门为每一次大数据分析专门建设数据分析系统，因此根本不存在多高的资金投入的问题。

大数据真正需要的是有想象力的头脑，需要将办案与相关数据紧密的联系起来，能够从一个点看到一个隐藏的面，通过这个隐藏的面和其他能够获得的数据进行交叉比对分析，从而在这个隐藏之面上分析出众多值得监督的线索。

这是一个从个案发现类案，从类案再回到多个个案的过程，而其中的要害就是大数据的比对分析。

而大数据比对分析的关键，又在于找到最有价值的数据源，找到一两个这样的源头，并通过沟通能够获得数据，剩下的就是挖掘的问题。

借助这些分析工具，最重要的是设置一个数据挖掘的模型，建立一套方法，就可以自动从众多的数据项目中对比出真正需要的结果来。

而这种对比分析获得结果的过程，就是大数据应用。

而这种应用并不费钱，费的是智力和想象力。

所以大数据应用的真正瓶颈是具有大数据思维的检察复合型人才。

这些人才必须又精通案件，能够查微析疑，敏感的抓住案件的关键点，而且有发现案件隐藏疑点的能力，又要有大数据应用的意识，能够知道从哪可以获取必须的数据，这些数据的分析可能会得出什么样的结论。

比如是在两个方面都高度精通才有可能通道大数据分析的障碍。

因此检察大数据应用，不在于投入多少资金，而在于储备和培养了多少大数据应用人才，以及给这些人才多少的激励，可以让其将如此难得智慧拿出来。

因为案件正常办也能办，也能够晋升进步，那就没有必要这么麻烦了。

而既然要这么麻烦，那就一定是要些说法的，是能够得到激励的，而且一定是有榜样引领的，才会有其他检察官投入心思办这个事。

所以，大数据想做成要投入什么？

要投入的不是资金，而是对人才真正重用，是投入实实在在的职业上升机会。

对大数据不以为然的，也没有错。

因为大数据也好，以前的一些智能化办案系统也好，不少确实是华而不实，什么机器人了，能够代替检察官自动写文书写报告的超级智能系统了，很多都是唬人的，不是替代人，反而是把人搞的更累了。

既然更累，那自然还不如回到从前，没有超级智能系统的时代，有个电脑打打字就挺好，不要搞怎么多系统，成天要填各种案卡，然后很多数据还要手工统计，一定也不智能，甚至也不够系统。

他们的不以为然，他们是对司法智能化的某种失望。这种失望很值得理解，因此这些系统确实没有带来其所宣称的福祉，反而是消耗和折磨。

现在到了大数据，这些失望的人仍然燃不起希望，因为他们的信心被消耗没了。

他们觉得还不是一个样子，说的都挺好，最后还是不行。

而且大数据这个事也不是每次都靠谱啊，你原来以为可以这个数据，那个数据对比一下，就很快得出某一个结论，后来才发现还差的远着呢，而现在要其他数据，哪那么容易呢？

大数据还有一个特别大的困难就要数据，因为很多数据并不为司法机关掌握，而调取数据，有时候也没有足够的法律依据，所以只能靠沟通。

有时候就是求数据，像是在乞要。

所以数据来源很不稳定，也不顺畅。

这样一来，有些即使设计很好的数据模型，因为数据拿不来，也还是用不了。

而有些数据模型也算错的时候，把现实估计的比较简单的时候，这样一来既是一开始即使好不容易拿了一些数据回来，还是有可能扑空。

这就像科学实验一样，可能要一遍一遍试错。

但问题是领导有没有耐心这样试错，一遍一遍再去乞要数据。

一定会在乞要不顺的情况下，抱怨大数据不靠谱，并无法做到心想事成。

就没有什么事情可以心想事成，可以一次性就成功。

大数据并没有那么灵验，也没有那么好用。

但是大数据绝对不是没用，大数据精妙的模型，需要对案件和数据的双重理解，需要对其间变量的准确预测，而这肯定不是一蹴而就的，成功并不是那么容易。

失败是大数据的成功之母。

想要应用大数据者，一定要记得，你一定会要经受无数次的失败，才会慢慢接近成功。

大数据思维本质是对数据时代信息分布的全局观。

是以案件为原点拓展司法视野和维度，运用整个社会的信息网络来破解司法中的瓶颈，来开拓司法的疆界，来参与社会的治理。

对大数据的认识就是对信息社会运行规律和管理模式的深层理解，但这种理解并没有教科书的路径，都是在摸着石头过河。

而一旦能够过河，就可以占到了更高的思维维度来审视司法和社会，从而实现某种降维打击式的巨大突破。

这种大杀器的司法能力怎么可能轻易获得呢？

它一定是需要极大的耐心和定力。

问一问自己，我们到底有多少耐心和定力呢？

我觉得不要轻易的承诺什么。

最好还是让事实来说话。

第三章：检察大数据模型

啥是大数据，啥又是模型？

大数据自然是很多数据，而很多杂乱的数据也没有任何意义，需要进行系统整理，需要排列组合，需要筛选、比对、勾连，而这就需要某种逻辑规则和方法。

这些对很多数据进行有机整理的逻辑规则和方法就是模型。

这个模型本质上是数据模型。

而我们一般看到的是逻辑模型，某种数据之间的条件关系。

因为比较曲折，因为比较复杂，用简单的语言很难准确描述的时候，往往就需要借助数学公式。

但是因为我们司法领域的所谓数学模型都太简单了，因此往往用语言描述也是可以实现的，因此往往表现了非常简单的数学公式与文字描述的组合。

你经常性看到的大数据模型就是这样的。

因此，某种意义上你把这种检察大数据模型当作应用题来看待。

发现这个数据模型的可能就是某一个个案，这个个案涉及到某一块数据，这块数据与某些其他数据发生一些比对、关联之后，就可能得出一些特定结果，这个结果中就会包含很多密集的犯罪线索，从而发现一个诉讼监督富矿。

当然这样说是非常简单的，实际上的情况可能是需要好几块数据，进行比较复杂的关联，才会接近监督的目标。

为什么会这样？

因为违法犯罪往往具备了某些共性特征，这些特征就像某些基因片段，你只要锁定了此种基因片段，通过特定的数据路径，就有可能很精确的锁定这些目标。

治病也是这个原理。

往往让你做多个检查，目标就是通过多个维度来判断识别病灶，最终判断病因。

这就是多维判定的原理，用一个两个维度不容易锁定的，用三个维度就可以锁定三位空间中的任何位置，用四个维度就可以锁定历史中任何空间的任何位置。

这是多维锁定法。

还有的就是剥洋葱式的层层递进法，每设定一个条件，不确定因素就会减少一部分，再设定一个条件，就会又少一部分，直到最后没有条件可以设定。只要设定的条件足够多，就可以不断提高判断的精准度，最终在人工审查的时候就可以减少工作量。

而大数据本来就是大海捞针，当然需要就是这种精确定位。

能够玩转大数据的，必然是精细的筛选和关联条件，不是过筛子一样晒出来，就是精确逻辑制导的判断出来。

因此，精确的逻辑推演规则就成为大数据最有价值的内容。

这也是大数据最值钱的地方。

它就像是点石成金的手指一样，能让很多平凡的数据变得不再平凡。

比如我在办案中发现了证物中有一个很不起眼的笔记本，上面记载了很多乱码一样的文字和数字，看不出来是什么东西。因为我怀疑这个笔记本持有人的身份可能是一个记账的人，因此也怀疑这可能就是一个加密帐本。

因此，我就把这个笔记本上面的文字，有文必录的誊录下来，并让嫌疑人逐页核对。核对确认之后，我就通过使用文字检索的方式，不断去判断这些文字、数字的出现规律，并根据规律识别出规则，根据这些规则重新判定这些文字和符号组合的含义。

就像重新建立一套语言一样，对这个笔记本进行重新理解，从而确认这个笔记本的账本身份，从而将一个销售假商标的案子，从未遂确定为既遂。

当时这些笔记本大概有七十多页，也相当于一个小的数据库，而我建立规则的方式就是对这个数据库进行重新分析解读的过程。

这里边值得总结的就是首先要一种大胆的想象，然后再不断的小心求证，在求证的过程要注意每一步的严谨性，从而避免结论发生偏误。

数学逻辑的好处在于它可以进行反复的推演。

这也是模型的本意，也就是你要建立一个虚拟的推演方法，从而在理论上论证可行，再进行实践操作。

之所以如此，那是因为真实的数据获取成本太高了，不能随随便便就要数据。

要了数据，最后还搞不出个名堂来，那下次要数据就更难了，因为你会让别人失去信任。

我们现在的问题是没有一个特别明确的公共数据获取机制。

这就变成了数据给你也行，不给你也行。

并没有一定非给你不可的道理，尤其是你要大数据，也就是要很多数据，那就更是没有特别明确的法律依据了。

因为对于具体办案来说，需要的数量往往是有一定限度的。

对于超出这个限度之外，你希望掌握比较全面的数据，再进一步深挖细查，但你并没有具体的案件性依据。

因为这个时候，你还没有案子。而你没有大数据，你就不可能筛出很多案件来。

这样一来，就成为一种逻辑怪圈。

如果根据个案需要来说，你是不符合规定的。

虽然你的目的出于公益，但是对于那种可能有案件线索的理由，是很难找到法律依据的。

因此，这种要数据往往要凭关系，给面子。

而如果给了一次面子，又没有搞赢，这就使得要数据要得更加理不直气不壮了。

人家嘴上不说，但心里肯定再说，干嘛，玩那。

那么多数据说给你就给你，你要的时候说得天花乱坠，能怎么着怎么着，结果什么动静也没有，现在又来要数据，而且一要还要那么多，谁知道你干什么呢？

就冲这一点，就为涨个志气，也必须把逻辑关系弄明白了，最好有了预演，从而确定这次要的数据是有谱的。

这样才能有信心去要数据。

而通过这个数据模型真的就能分析点什么东西来，尤其是通过数据的筛查最终查出一批案子，对数据提供者是有帮助的，数据提供者才愿意源源不断的给你数据。

而只有把几个数据模型跑通了，能够通过大数据真的提高了一些监督成效和办案质效了，大数据的运用工作本身才能让人信服，让人相信这个模式真正的可行，是真把式，不是假把式。

只有这样这个数据信用才能建立起来，才能获取越来越多的数据，让当你的数据资源增加了，可以分析的维度和范围就扩展了，从而可能得出的成果，也必然越来越多。

这就成为大数据应用的良性状态。

这些状态都取决于最初的模型是否能够打开局面。

这也是大数据应用的基本策略。

一定要避免战线太长，贪多就大，上马很多项目，最后一个失败会引发连锁型的失败。

最好的还是采取步步为营的战略。

先拿出几个最容易跑通的项目先运转起来，等出了实效，我指的是真正的实效，而不是表面上的好看，才可以再运行更多的项目。

因此，检察大数据应用也有一个循序渐进，先模型再实践，有实效再推进，分阶段推进的过程。

急躁冒进是大数据应用的大忌。

数据信用比数据本身还要珍贵。

第四章：检察大数据远在天边近在眼前

谈到检察大数据，往往都在想怎么从外边要。

但其实我们自己也有很多的大数据，也有守着金饭碗要饭吃的问题。

因此，检察大数据其实有内部和外部两个大数据的问题。

所谓的内部大数据，主要是通过检察监督办案过程中所积累下来的各种各样的数据。既包括案卡中的数据，也包括审查报告所承载的更为全面的案件事实数据，还包括电子卷宗中更为丰富的数据，进一步还包括案件材料中的各种电子数据，其中包括手机数据、电子设备数据、电子账簿、银行流水，甚至影像资料某种意义上也是一种数据。

这些数据我们应用到什么程度呢？

可以说九牛一毛都不到。

就比如案卡数据，基本都是固定的事项，稍微活泛一点都统计不了。

比如盗窃案件可以统计，但是如果说超市盗案件，那对不起只能手工统计报送，就是这么不智能。

还有比如量刑建议的数据，审查起诉期间提出的量刑建议有统计，审判阶段如果调整量刑建议了，只统计是否调整和调整的时间，但没有调整之后的刑期，很多人就只好把审查起诉期间的量刑建议再改了。

改的有道理，也有道理，因为这毕竟是最终的量刑建议，如果不填上的话，那就意味着案卡统计的量刑建议只是一个阶段性的不作数的量刑建议。

但是改的也没有道理，因为那个量刑建议明明是审查起诉阶段的量刑建议，不是审判阶段的量刑建议啊，不是修改之后的量刑建议啊，从字面上来理解好像不应该改啊。

但是如果不改的话，我问你审判阶段调整后的量刑建议，也就是本案最终的量刑建议写哪呢？

有人说，那可以看电子文书啊。

但是电子文书的结果能汇总统计么，如果不写到案卡里去就完全没有统计意义。

这就是现在的问题，所有的统计都依赖于案卡，而案卡又非常的机械和局限，还十分的滞后。有任何稍微前瞻一点的统计都没发完成，比如现在认罪认罚听取意见要求同步录音录像了，这个事情3月1日，提前几个月文件就发出来了，但是案卡上有这个事项么？没有。如果你想了解同步录音录像的人数次数，还得需要下面手工报送。事实上，任何一个统计事项的添加都需要特别长的周期。

而案卡的数据项也不是自动填录的，绝大部分仍然是手工填录的，案卡多，给承办人带来的负担也是十分繁重的。

有一个事情，我呼吁过很多次了。

为什么不能在统一办案系统中引入自动检索机制？

就像期刊网中的高级查询功能中就有全文检索的功能。

为什么就不能对办案中的各种文书和审查报告进行检索？

比如我想查超市盗案件，我只要选择案由是盗窃，然后起诉书中包括超市这个词的，那基本就能够锁定超市盗的案件。

即使会有一些误差，也不会比人工统计的误差更大。

一旦能够实现文书和审查报告的全文检索，那历史上所有的案件，都将成为大数据的一部分被利用起来。

因为这些所有的文本都可以通过检索的方式进行有机组合。

经过几轮次的有机组合就精确的匹配一些非常难得的数据结果，无论是对于监督，还是对于社会治理都具有极大的意义。

我们实际上一直让办案数据的资源在睡大觉，然后只知道不停的管别人要数据。

我们其实首先应该管自己要数据。

关于全文检索的机制，不仅要扩展到所有文书，还要扩展到所有电子卷宗。

因为绝大部分电子卷宗都实现了双层扫描，也就是将卷宗扫描为图片，对于很多机打的页面，其实已经完成了文字识别，从而方便撰写报告时进行复制。

既然已经识别为文字，就完全可以通过文字进行识别。

这样一来，全文识别的范围就不仅扩展到文书和审查报告，还可以扩展到电子卷宗中被文字识别的部分，这部分包括绝大部分的言词证据，还包括各种书证、鉴定结论和书面材料。

这就可以将文字检索的范围扩展到侦查卷宗的绝大部分。

这就意味着我们可以通过自由的对所有案件的基础证据进行自由的检索，进行更加广泛的排列组合，从而可以汇总和收集到相当大程度的基础信息。

比如，我想研究超市盗嫌疑人的身份情况，学历情况，职业情况，通过这些基础检索就可以实现，还有我想研究一下被盗超市主要是哪个连锁品牌的超市，都大致在什么地点，也很容易检索到，这些都不需要下面再报送数据，而且更加准确及时高效。

这会导致汇总数据的效率极大提高，成本极大降低，而且范围可以非常广泛。

比如，如果在统一办案系统整体上都实现这个功能，那么高检院就可以足不出户就能够瞬间检索全国范围内数年之内的相关信息，对于服务决策意义将多么巨大。

而且这都是自己的数据，不用求人。

有时候，求人不如求己。

而且数据都已经在手里了，也没有任何理由不把它用好。

当然还是会不少人不以为然，认为这无非就是服务调研，对于办案好像帮助不大。

其实非也。因为全文本检索，意味着自由检索，只要检索的人心中有目标和框架，又了解案件信息之间的关联，只要有足够的想象力和耐心，就可以通过检索获取很多重要的监督线索和治理线索。

而且打通全文本检索之后，不仅是人工的碰撞性检索，还可以开发出多维度的自动检索算法，也就是让机器像人工智能一样复杂的全方位的检索，也就是智能搜索功能，也就是一种监督算法，为了一个模糊的目标，对办案系统数据库的全文本进行成千上万次的检索、比对，从而分析出一些有价值的监督路径，我们可以称这种算法叫做监督算法。

但是监督算法必须建立在办案系统文本检索的基础之上，而且这种数据基础甚至远远不限于案卡、文书、审查报告和电子卷宗，还包括所有个案所留存下来的各类电子证据和视听资料。

现在的问题是，统一办案系统中只有电子卷宗的扫描件，很少有电子证据和视听资料，这类证据还是躺在侦查卷宗中的光盘里睡大觉。

很多光盘到后期基本读不了，如果没有备份的话，其实基本上就灭失了。如果你真看的话，只能让公安要刻录一份，这个刻录的一份，要么只是在光驱上读一下，要么是刻录在办公电脑本地看一下。看完基本也就完了，统一办案系统既没有上传的地方，也没有上传的要求。

也就是统一办案系统上传的证据部分，只是证据中的纸质载体这一份，凡是数据载体的基本都没有上传，而现在数据载体的证据越来越多，越来越重要，不仅对各案重要，对类案更加重要。

在此，我强烈建议，案件受理部门在扫描上传电子卷宗的同时，应该上传案件中所有的数据载体证据，包括电子证据和视听资料等，统一办案系统应该作出相应制度安排，即使这个文件大一点，占服务器空间大一点。

因为它们就是大数据本身，我们一直想人家要大数据，但是我们却把送上门来的大数据扔了。

这些证据可能在一两个案件上来说感觉数据不是很多，但是所有案件汇集起来可是不得了的。

它包括所有曾经涉案的手机全部数据信息，电子设备数据，银行记录，视频资料等等。

这些信息再与案件中案卡、文书、审查报告和电子卷宗的全文本检索信息进行交叉对比分析之后，将产生怎样的化学反应？那一定是不可限量的。

而这些就在我们手里。

我们还等什么呢？

第五章：大数据思维首先是领导思维，其次才是办案思维

我们在提倡大数据思维，首先想到的就是让承办人开动脑筋，想出模型来。

可能有用，但是用处并不明显。

因为对于办案来说，对于大数据的应用有一定的偶然性，需要碰，也不是说有的案件都用。

而且即使有用，也有一个循序渐进，渐入佳境的过程。

最重要的是，就算是用了大数据思维和不用大数据思维有什么不同说法么，对承办人有什么的进步发展有什么直接的帮助么，好像也没有明确。

如果这一点不明确的话，那有多少人愿意开动脑筋呢，更多的人就会来个顺其自然吧。

而且说实在话，大数据思维也不是普通承办人能够充分用起来的，如果真的需要与有关部门的协调，承办人层面也协调不了，即使在内部整合办案力量都协调不了。

而且运用大数据思维即使效果好，但付出的心力和创造力必然多，如果应用到商业领域的话，那可能都会有巨大的商业价值的，也就是说这需要极大的创造性的投入，而创造性是最稀缺、最宝贵的，但是即使这些创造了一番，如果没有得到适当的鼓励，反而因为其中的一些纰漏，受到责备的话，那样就不太可能有人愿意这样投入了。

即使你再鼓励他，他也知道你并不真的把大数据思维当回事。

所以大数据思维首先是一种领导思维。

是检察长这个层面真的认识到大数据思维可以扩展监督能力，可以跳出案件看案件，可以帮助我们透过现象看本质，更容易发现问题的实质，能够更加精准实现批量监督，可以对违法犯罪问题实现降维打击，相当于社会违法问题的大规模杀伤性武器。

而能够研发这种大规模杀伤性的监督武器一定是很大的功臣，对监督职能的发挥具有战略性的价值。

对于这样的人才一定要给予相应的鼓励、奖励和晋升机会，也就是给予其智力投入相当的回报，这样难得的复合型人才才会进一步的投入，才会觉得付出没有白付出，其他的观望的人才会进一步跟上来。

那种以为一招呼就行的想法，是天真的，也是对智力劳动极大的不尊重。

这些领导其实说白也是没有把大数据思维当回事。

很多人也认为这不就是内勤分析点数据么，弄个小孩就行了，他们经常将刚入职的年轻人称为“小孩儿”，甚至在自己进步后将同龄人都能称为“小孩儿”。

他们认为这种分析数据的事无非就是“小孩儿”的事，而自己作为领导可以堂而皇之的说自己手机都不太会弄，电脑也不会弄，都是“底下人”帮着弄的。

也可能是真的不会弄，也可能是嫌麻烦懒得弄，总之说这话时是十分得意和自豪的，因为这意味着他有人可以支使，这样才有领导的架子。

不会用手机、电脑不仅不是丢人的事，还显得自己很有派了，给他们报的东西都要打印出来看，不会用电子设备不是因为他们笨，是因为他们有权选择阅读的介质，这不是智力问题，这是权力问题。

同样的，他们声称不懂得数据，不了解大数据，也不是丢脸的事，那是因为他们有权力不用做具体的基础性工作，不用亲自分析数据、撰写报告，当然他们也就不用去看数据，无需了解数据的分析方法，他们不用做，同样也是因为有人给他做，他有权不用做。

而他们远离数据的原因其实就是在远离基础性工作，远离具体的司法工作，从而再次证明自己的领导身份，以及可以不用做基础工作的权力。他们从内心深处认为这些基础性工作是低下的，他们是不屑于干的。

但其实好的领导即使不用自己写报告，也要知道报告是怎么写的，数据是怎么分析的，即使不用办案，也要知道案子是怎么办的，才能真正的领导好办案。

而且现在的大数据已经不仅仅是统计报表的基础数据那么简单了，现在社会已经被广泛的被数据化、信息化，数据就是社会信息和管理信息的基本载体，是各种权力运行的基本形式，只有知道大数据的产生方式，应用方式，数据之间关联后所可能发现的问题和线索，以及这些数据分析模式在更大范围内推开所可能才生的批量化影响，才能算是真的懂得现代化的办案方式。

就好像不懂得信息战电子战就无法指挥现代战争一样，不了解大数据其实也很难指挥好现代检察工作。

因为检察工作，法律监督工作，就是需要与社会紧密关联，而现代社会管理的基本形式，包括司法管理的基本形式就是量化管理。

不再是笼统的说好与不好，评过什么奖，有没有一两个过人的经验，而要看整体的数据指标怎么样，这些指标加权之后与其他单位相比是一个什么样的态势。

不是说一个单位曾经辉煌过，就永远可以躺在过去的功劳簿上睡大觉，不是说有一两个经验出了彩，其他的就都好了，不是说过去好现在就一定好了，是骡子是马必须拉出来溜溜。

这个溜溜比拼的就是综合的质效指标。而这样也才能公平，才能促进良性竞争，因为这对每一个院都是一样的，只要你有进取心，有进步，通过数据都能看得见。不管过去怎么样，数据能够直观的反映出你的现状。

当然我们也不能完全唯数据论，数据也有自身的局限性，但是数据一定比笼而统之，只定性不说程度，只看一点不及其余要客观公允得多。

这也是各行各业都进行量化管理的原因。

这是因为现代社会越来越复杂了，必须以精确的量化指标才能反映出真实情况，而这些具体的数据指标也在不断完善丰富，也会越来越接近真实情况。

各行各业都是如此，都在用数据进行管理，而这些数据整合起来，与具体的案件结合起来，经过一些具体的条件进行分析比对，就能够发现案件背后具体的行业管理漏洞，就能够发现批量的监督线索。

这个监督线索之所以是批量的，就是以为大数据能够批量的发现同质问题的原因，这也是大数据的好处。

大数据可以实现监督能力的量级提升。从原来零星的偶然的碰，到现在是批量化的筛选、提取和锁定。

而且一旦掌握了数据分析的方法，这种监督路径和模式是可以复制的。

这就使得监督模式从狩猎型的捕捉，变成了农业型的耕种和驯养，甚至是工业型的大规模加工制造。

因此，对于大数据的懂与不懂就不是摆不摆架子的问题了，而是对现代检察管理工作是否适应的问题了。

因此，可以说大数据思维首先是一种领导思维。

让一个没有大数据思维的人领导现代检察工作，就如同让一个只有冷兵器作战经验的人领导现代战争一样可怕。

他们的冷漠和盲目将扼杀任何具有大数据思维的承办人，在他们眼里，那些难得的复合型人才只是“小孩儿”而已。

第六章：滚雪球算法与监督矿脉的大数据探查

需要监督的问题往往隐藏在大量数据的背后，如何发现是一个难题。

有人曾经比喻这种现象就像冰山一角，大量的问题隐藏在水面之下。

但是我们知道冰山的特点就在于，你发现了冰山的一角就自然而然的发现了整个冰山。

这个一角与冰山整体是紧密相连的，但是监督中的个别问题与整体问题并不必然是这种简单一角与冰山的关系。

你有可能找到了一角，但是它下边并没有冰山，其实它更像矿石与矿脉的关系，它是一种若隐若现的关联关系。

你在一个地方发现的矿石，但并不是马上能够发现矿脉的，这个矿脉隐藏在地层之下或者大山之中，它的结构并不一定集中完整的，很可能是断断续续、零零散散的，只在个别地区相对集中。

而且这些矿石想要开采出来，必须打破层层的岩层包裹。

尤其是你还要知道往哪里挖，如果挖错方向，即使耗费巨大的资源也是徒劳无功。

而茫茫的大地可不像海洋中那么容易探查，而岩层与矿脉的关系也不像冰与水的关系那么容易分辨。

都是岩石，你知道哪些是矿石哪些是普通的岩石，这颇要费一番功夫。

而有些金属储量极为稀有，比如换金，探查起来真像大海捞针一样，有些就隐藏在河床的沙砾之中，所以才需要淘金。有些监督数据也需要淘金。

这些非常像监督问题，它们并不容易发现，它们具有极强的隐蔽性，分散性，随机性，绝不是显而易见，明摆浮搁的放在面上。它需要深入到司法和社会数据地层之中进行仔细勘探。

而数据也有别于土壤，它又有它自身的一些规律，探测数据的技术需要的是算法。

所谓算法就是一些数据方法和数学逻辑，它可以帮助我们把我们需要的数据算出来，而把不重要的数据过滤掉。

比如有些人关注到空壳公司，觉得这里边有监督线索，可以深挖。

但是空壳公司并不会有一个名录供你查询，它是非常隐蔽的存在，非常害怕人知道。

从哪里找呢？

常规的思路是我们要大数据啊，要工商登记数据、税务数据、银行账户数据、房地产登记数据、户籍数据、水电天然气数据，然后这么一对，就很容易发现。比如有工商登记，但很少纳税，公司账户很少有流水，公司地址不存在或者为私人住宅等，水表电表都没走过字。

这不就是空壳公司么？这很可能是。

但是这些数据从哪里来，你从哪要怎么多数据，张口就要一个省的数据，人家给你吗？都能配合么？如果有些数据要不来，对不全是不是就很难确定是空壳公司了，那是不是已经要来的大数据也便没用了。

如果怎么也发现不了，那么还怎么继续向其他单位要数据呢？

而且你要这么多的数据得有一个具体的理由吧，仅仅觉得有可能是远远不够的。

很多时候，我们手里只有很少量的数据，几乎少得可怜，因此我们也不太在意。

我们往往眼馋很大很全很多的数据库，总是觉得这些数据能要来就好了，如果要不来就什么也干不了。

就这态度往往会陷入一种僵局，就是什么事也干不了。

其实我们一点也不要小看了我们手里的有限数据。

比如不少案件中经过实质审查后，都会发现个别的空壳公司，但这些公司往往之间并没有什么关联性，而数量也不是那么多。

这些小数据有用么？

我告诉你，它太有用了。

首先，这些数据已经经过实质判定就是空壳公司了，无需进行什么交叉对比了。

其次，这些空壳公司都有一些空壳股东吧，这些通过各种企业查询app就很容易查到。

就比如，你有10个空壳公司的名称，你用这10公司名，查到了50个空壳公司的股东。

而空壳公司的股东意味着什么？都是挂名的，而且都可能要冒一些风险的，这些人往往可能并没有什么正当职业，更不要说有真的公司了。

有真公司的，有合法企业的人，谁会去组成空壳公司呢。

这也就意味着这些空壳公司的股东，可能会惯于参与到这种空壳活动之中，他们之间可能会存在某种联系。

所谓人以群分，这些人也扎堆的。

实践中，我也发现了，注册空壳公司的人，往往注册的不只一家，一个注册空壳公司的，其所作为股东参与的往往都是这一类公司的，他就是干这个买卖的。

而与他的合作伙伴，也往往是这样的人，这就是一种所谓的吸附效应，这些人往往互相吸附在一起，就是以空壳公司为节点，很可能会织就一个空壳网购了，这就与暗很像。

根据这个吸附原理，我们就可以设计一种滚雪球算法。

也就是通过这10个空壳公司的50名股东，一路查下去，就查出这50个股东注册的200家公司很有可能也存在类似的问题，然后这200家就很可能查出1000个股东，这个1000股东又衍生出5000家公司，然后就是25000名股东…

按照这个算法一路鼓动下去就会越滚越大，而这个雪球所吸附的都是类似的人员和类似的公司，他们相互粘合在一起，不断滚入我们的数据雪球之中。

这种滚动方式就可以让一开始仅有的少量数据，通过一些恰当的滚动方式吸附一些同质的数据。

这就方式的起点低，不用求人要很多数据，也不用动用过多资源进行海量交叉比较，而且成本可控。

有多少分析资源就先让数据滚动到什么程度，只能分析1000个数据，就到了1000就先暂定，开始分析。如果有了进展就再逐步扩大到五千或一万，然后再分析。这样可以避免司法成本无限膨胀，自身无法承受。

待到通过滚雪球算法筛查出有价值的监督线索，取得监督实效后，再向有关部门要数据也就有了底气了。

巴菲特说过只要找到一个足够长的斜坡和足够粘的雪，就可以滚出一个很大的雪球。

这是因为雪与雪之间比较容易粘合，而且有充分的时间来相互吸附，就会越滚越多。

而且还有一个重要的条件就是因为重力的原因，雪球会从山顶自己滚下来，只要有一个初始力，就无需任何的驱动力了。

滚雪球利用的算法也是这个原理，它在滚动的过程中会不断释放出监督线索，而这些线索就会作为一种激励，不断地驱使这个雪球越滚越大。

滚动式算法是解决大数据初始阶段什么数据都没有，也就是数据本钱很少的启动方案。滚动式算法允许我们一开始小本经营，赚到多少监督成效，积累了多少数据之后，就可以越做越大。

当我们积累的数据足够多的时候，才有能力进行更多方式的分析比较，而这些是我们没有多少数据的时候所无法支撑的。

所以大数据一开始不用盲目求大，可以从一个点开始，运用吸附效应不断的累积，步步为营，这是一条相对稳健的大数据监督路径。

第七章 | 出庭大数据和算法分析之一：有时候大数据是个副产品

许多人都在问大数据到底是什么，对司法有什么用，在司法中到底怎么用？

笼统的描述不足以解答这个经典三问，我尝试用出庭能力培养平台的应用情况，用解剖麻雀的方式、实例分析的方式来尝试性地做一下解答。

有的时候大数据其实真的是无心插柳的事，不是要大数据就有大数据，而是你在不经意之间就汇集了一个很大的数据池子。

数据很有用，但人才是最最有用的。

所以，其实很多真正好的系统，其实是用行为的方式在无声无息之间汇集起数据海洋，并不是一种刻意的录入。

比如微信，我们每天看那么长时间，浏览、阅读、发朋友圈、点赞、回复、群聊、支付、查询、应用各种小程序，有人强迫我们没有？没有。是一种刻意的录入数据么？肯定不是。

但是我们却在不经意之间是不是生成了许多的数据，这些数据被记录和汇集的量又多么惊人，这就是我们每天生成的大数据，我们丝毫没有感到任何负担，不仅是心甘情愿，而且是不知不觉。

其实微信的目的也不是为了生成这些社交数据，它本质目的在于更加广泛的链接，更加经常的使用，这些数据对它们来说其实是一种副产品，但不得不说，这些副产品很有用，很有商业价值。

但是可以肯定的说微信不是为了获取社交数据而存在的，它是为了人的链接而存在，如果收集收据、给予数据威胁到了链接的便捷和安全，那将是无法承受的。因为一旦失去链接，将不再有新的数据生成，这是本与末的关系。

而我要说的出庭大数据其实也是这个道理。

1.出庭大数据是什么，有什么用？

我们说出庭大数据还不是关于出庭的所有数据，还只是与出庭观摩、出庭能力、出庭经验有关的数据，包括出庭信息、预约观摩信息、对出庭表现的评价、对出庭经验和能力的衡量、出庭经验的系统总结等等。

但这仍然并不是最主要的，最主要的还是公诉人能力出庭能力的整体提升和持续提升，形成一种更加公平广泛的竞争机制，让每一个勤奋而有才华的人能够脱颖而出，又因为他们的脱颖而出而激活整个刑事检察队伍，激发每个人的荣誉感，实现整个刑事检察队伍的更快迭代进化，从而适应不断提高的法治需求。

我们要的是更好的人，数据是媒介和工具，也是衡量的标尺，但不是目的。

数据是通道，人才是目的。

之所以萌生了设计这个系统的念头，主要是有一度我们的出庭能力令人堪忧，在一些个案表现非常明显，不能满足庭审实质化的现实需要。虽然很多出庭也没有什么硬伤，从出庭的行为来看整个场面都中规中矩，并没有大的问题，然而这其实就是真正的问题所在，即公诉人习惯于中规中矩和照本宣科。这种方式已经不能适应庭审实质化的要求，习惯于念稿，一旦面对侃侃而谈的辩护人以及已经突发的状况，就会呈现疲于应对、难以招架、不知如何是好的态势，一旦公开就会引起负面评价。而庭审公开化是大势所趋。

面对以审判为中心刑事诉讼制度改革所带来的新趋势，传统的跟庭考核、业务评比和模拟法庭等出庭能力养成方式已经不能适应新的需求，亟待新的变革，而这个变革最终是靠大数据驱动的。

（1）跟庭考核问题

以往来说，每年全市会组织跟庭考核，每个院抽查一场，每年大约二十多场，进行了五六年，但很多出庭问题依然如故。

因此，我就在思考一个问题，为什么我们那么优秀的公诉人面对并不是一线的辩护人，为什么发挥得并不理想？

为什么同样看到直播，公诉人那么紧张，而辩护人为什么可以超水平发挥？

为什么普通的公诉人，辞职成为律师之后，就会一下子放开，而在自己控方阵营的时候怎么就那么畏首畏尾？

这些问题如果用一句话回答，就是公诉人缺少竞争机制，而辩护人适用的是丛林法则，在两种环境中进化的是两种不同的司法物种。

公诉人长期习惯于闭门开庭，北京每年两万出庭案件，抽查20件只相当于千分之一，加上各院自行组织的几十场观摩庭，加一起不到百场，可谓杯水车薪。

而其他的庭审没有任何同行或者领导到场，官方媒体报道多以正面为主，绝大部分的庭审都处于无人评价的“暗箱”状态。开庭到底效果如何，无人知晓，而且对结果的影响也不大，也没人关心。

（2）业务评比问题

从公诉标兵能手的成长轨迹，以及公诉人的整体发展进路看，主要依靠的是审查报告以及上级的认可与赏识，而不是法庭的表现。领导也没有时间去看每一场出庭的情况。

当然这也是庭审形式化和司法行政化的体现，从根本扭转并不容易。

但是以审判为中心的诉讼制度改革是一个不可逆的方向，庭审完全直播虽然未必合适，但是庭审的公开化却越来越成为趋势。

其实也不是完全不看重庭审，一些重大案件会有督办机制，会要求公诉人按照已经确定的三纲一词进行出庭，也就是完全按照既定的脚本进行出庭，所以会发现辩护人或者被告人一旦抛出新的观点，公诉人就会在答辩提纲翻找，但是庭审具有不可预期性，不能都被预测到。这种翻找的过程会削弱公诉人的气势和自信心。

公诉人不敢自我发挥的原因，一是不敢挑战权威，二是挑战的风险太大。

可以说公诉人是带着锁链在跳舞。而公诉人日常养成的习惯也是这种机械出庭模式。

因为我们反复强调的主要是规范，不是真正的出庭技巧和出庭效果，公诉人习惯于宣读事先准备好的出庭意见，不善于即兴表达。

这其实也源于法庭对我们的迁就，如果是辩护人法庭则经常会要求直接说重点，书面辩护意见庭后提交法庭。这种迁就反而对公诉人是有害的，日积月累下来，就养成了书面出庭的习惯。到了真正需要即兴表达的时候，也就失去了勇气和底气。

但是法庭的变数在增加，出庭的挑战将越来越大。有些人认为一些大庭效果不好是直播的错，但是其实直播是公平的，如果公诉人出彩，也一定会获得喝彩。事实上，出庭不仅仅是结果，过程也非常重要，这才是庭审实质化的真谛。

总而言之，从深层次来看，出庭就是缺少竞争机制。

辩护人出庭出的好，不仅影响本次的委托费用，而且会影响其知名度和美誉度，从而直接影响未来的身价，尤其是直播，将使这种影响放得更大。

辩护人不仅要与同席的辩护人比，还要与所有其他的辩护人比，只有在比较中才能获得更大的进步，才能直接获得名与利的回报。

正因此，辩护人更加热心于竞争，市场就像一只看不见的手，在推着辩护人往前走。

出庭对辩护人至关重要，因为它看得见，会给当事人及其家属留下直观的感受，会给未来潜在的客户留下印象。虽然很多时候也不一定会获得判决的认可，但是人心都有杆秤，还是会有一个基本的评价的。

这就导致辩护人很看重出庭，庭审成为他们展露才华的舞台，成为宣传自己的最好窗口。因为之前的很多工作都不如这个直观。尤其是在出庭上压倒公诉人那一刻，一定会给委托人留下深刻印象。

相反公诉人的竞技场不在法庭，很多时候是在幕后，在审查阶段，与领导的接触过程中。

公诉人业务竞赛，也是制作模拟审查报告所占的分值最大。因此公诉人主要是以审查的案头工作取胜，而不以出庭辩论取胜。

这背后有很多深层次的问题，如何在现有的制度框架下，在尽量避免与制度发生深层次冲突的前提下，提高公诉人的出庭水平，而且使行政成本最小化，这就是需要考虑的问题。

（3）模拟法庭的局限

近几年，在大专院校中盛行的模拟法庭也在检察系统中流行开来，并被命名为“实训”，试图成为提高实务能力的主要培训形式。但是这些适用于大学校园中的培训形式，并不一定适合已经具有实务经验的司法工作者。

首先，真实的法庭环境无法模仿。

比如一些复杂案件，角色扮演永远无法模拟法庭真实的瞬息万变。

模拟法庭的脚本虽然来自真实的案件，但往往是在审查报告和侦查卷宗基础之上的艺术加工，为了保密不会直接使用真实的案件材料，这必然会剔除掉一些细节信息，而且即使用这些真实的材料与真实的案情也存在信息的筛选、过滤，而这些看似冗余的信息才是真实性的基础。

为什么检察官扮演被告人总是演不像？因为事情就不是他干的，他并不了解被告人的内心，甚至也不了解案件真实的全部细节，更不具备被告人的性格特征和知识结构。

即使演辩护人也很难演的像，因为他没有收诉讼费，也不了解一件案件的成败对律师身价的影响，他不会有这个压力和动力，因为他就不是辩护人。

其次，模拟的成本很高。

对于经历过“实训”的人员都有这样的体会，一周的封闭、彻夜的打磨，筋疲力尽之后，最终也只是蹩脚的“话剧”。

也不能说完全没有收获，但用能够开好几个真实的庭的时间来弄一个模拟的庭，这个时间付出是否值得？

而且编写模拟法庭的脚本还需要更多的时间，为了封闭培训也需要投入大量组织和行政成本，还要中断大量业务骨干的办案工作，为此需要付出更多司法资源。

再次，“实训”的受众很有限。

为了保证每个人都有适当的角色，而不仅仅做看客，培训的规模需要控制，只能保证少量的人员参与，而由于师资、组织、时间成本高昂，每年举行的次数有限。

总体来看，受众非常有限，难以普及开来。

最后，“实训”的课程内容有限。

开发一个课程，就像在打磨一个剧本，周期比较长，一旦开发之后，总要用一段时间，否则确实很浪费。

这样，“实训”中可供选择的课程也是有限的。而且课程的开发，与当下最新的业务热点也有一定的滞后性，课程开发总是有一定的周期，但是社会的发展日新月异，案件类型、业务需求也随之更新，计划总是跟不上变化快。

因此用“模拟法庭”、“实训”的方式来提高司法实务能力总是感觉力不从心，无法跟上新的形势有着深层次的内在原因。

现在症结找到了，我们又能怎么解决呢？

真实的庭审是很好，但谁又有那么多时间来旁听？而出庭的好坏又怎么来衡量，它毕竟不像审查报告或者法律文书，有一个文字载体，相对容易评价和比较。

想要把一个人的真实庭审水平搞清楚，除非把他的大部分庭审都听一遍，而且不仅是要给他的庭都听一遍，还要给大多数公诉人的大多数庭审都听一遍，不要说上万件，就是几千件谁又受得了呢？

以前市分院组成一个专班，一年也就听个20多场庭审，你这个上千的庭审简直就是天方夜谭。这几乎是一个不可能完成的任务。

但这个不可能完成的任务却通过大数据和算法完成了，出庭能力培养平台上限后，出庭观摩的量平均每年都达到上千场，这与之前相比提高了一个量级。

怎么做到的？

主要是也是通过行为产生数据的方式，不是命令填录的方式录入。

发布出庭信息的人为什么愿意发布？观摩的人为什么愿意甘愿奔波的来？撰写出庭百科的人为什么愿意写？这是因为有积分回报。

付出是有回报的，大家才愿意做。

而这些积分可以通过算法自动汇总，根据汇总的积分还可以进行排名，排名靠前自然是光荣的一件事，愿意出头露脸的自然对此乐此不疲，而只要有一些人吃了螃蟹，其他人就可能眼红，而有人真的因此获得进步，就可能产生实际的激励效应。

而参与的人多了，又会引发水涨船高，积分只有越来越高才能提升排名，有时候真是不进则退。

这些心理博弈和真实的利益驱动，促使公诉人愿意使用出庭系统，分享出庭经验和学习出庭经验，他们收获了积分，收获了荣誉，而我们收获的是一批又一批更加优秀的公诉人。

我们彼此都实现了目的，而大家谁也没有勉强谁。

这些公诉人在不经意之间，就像打游戏中升级打怪一样就实现了提升，而这种不断累积的出庭、观摩和百科数据，既是这些公诉人流淌的汗水，也是他们收获的经验和能力提升，更是宝贵的出庭经验财富和出庭管理数据，决策者可以从中看到更多，看到院际之间的能力比拼和此消彼长，看到的出庭经验的输入输出的“贸易数据”，也可以看到谁因为勤奋从经验输入地逐渐成长为经验的输出地，就像发展中国家的弯道逆袭，而谁又由于固步自封、安于现状又不断向下滑落、被边缘化，都看得很清楚。

这些数据既有微观的，又有宏观，既有单位的，也有个人的，既有现实的，也有历史的，既有横向比较的，也有纵向发展的，这些数据非常重要，可以帮助我们更好的开展公诉业务和队伍的管理。

但这些数据并不是我们刻意追求的，我们真正追求的其实人的提升，而人的提升其实是数据的生成过程。

从某种意义上来说，大数据的生成过程要比数据的结果更加重要。

2.如何对不易量化的对象进行量化

这个系统在设计之初的时候就必须要面对一个难题，那就是怎么对庭审进行量化，以及量化什么的问题。

在回答这个问题的时候，我们首先要考虑的是，我们设计这个系统的核心目的是什么，那就是普遍的、持续的提升出庭能力。

而出庭能力又由什么构成？

那就是出庭的经验、技巧，具体来说就是能不能出大庭，出庭的真实效果怎么样。而且这种出庭效果应该是真实的、稳定的，是日常化的，不是偶然的，在一些特别选择的没有什么风险的庭审中煞有介事的拿腔作调。

我们要的是真正的实力，真正的能力。

而且我们有一个普遍的经验，那就是只要有一个同行在旁听，其实就是给公诉人以心理压力。因为内行看门道啊，普通人旁听听不出来的问题，公诉人一听就明白了。

因此，只要有一个人旁听就要对这个庭认真准备的，事实上我们之前跟庭考核的庭，公诉人也是要非常认真准备的，只不过一个人公诉人好几年才能轮上一会，太少了。

由此可见，只要出了一个观摩庭多多少少都会能力提升，这是一种承压型的能力提升。

但是也有人会是不是只要出庭就会有能力提升？也就是虽然没有在系统发布出庭信息，但我只要多办案多出庭不就也有提升了么？

这个也是可能的，但也可能后退或者没有什么提升，我们无法确定。因为没有观摩人员在场，也就是缺少一个内部评价。从这几年跟庭考核的经验情况来看，从整体来看，虽然庭没少出，很多时候其实是原地踏步，甚至后退的。这也是一段时间以来，出庭表现不良因此社会和上级机关批评的原因。

由此可见，没有外力推动，没有激励机制和竞争机制的引入，想要自然而然的进步和提升是不现实的，也是不符合实际情况的。

而且主要是你没观摩的庭审到底好坏我们没法评价，因此我们也就不好给你加分，而且我们也需要激励大家尽量的在出庭系统上发布，让大家可以分享，而自己也可以通过承压交流也可以提高。

从这个意义上来说，我们给完成一次出庭观摩任务的人都会对能力提升有帮助，但这个提升多少具有不确定性。

我们将这种能力提升以经验值来衡量，我们不能说你出了几个观摩庭就一定有多厉害了，但确实有多了一些经验。这个经验可用一定的数值来衡量。

如何合理呢？无外乎数量、质量和难度系数三个因素。

出的观摩庭多，承受同行注目的压力多，自然每一次都会认真准备一点，每一次的认真准备也必然会多多少少有一点收获。因此，我们把每一次观摩庭的基准分设计为3分，至少要设置3个观摩席位有人来旁听，只要有人来就有可能拿到3分内的经验值。

基准分是3分，并不意味着出了一个观摩庭就可以拿到，这还要看出得到底怎么样。这个出庭效果就由旁听人员来打分。

这个打分也不是随便打的，当时我们也是与资深的公诉专家一起设计了一个简约又比较全面的评价维度方便操作。共有7个维度，分别赋予了一点的权重：

出庭行为，所占总分百分比10%

讯问、询问，所占总分百分比10%

举证，所占总分百分比20%

质证，所占总分百分比10%

出庭意见，所占总分百分比20%

辩论，所占总分百分比20%

综合表现，所占总分百分比10%

这七个维度也各自有一定的评价标准，这在打分页面出现时会展现出来，具体来说就是：

出庭行为，用语规范、吐字清晰，着装规范、仪表整洁，精神饱满、举止大方；

讯问、询问，方式得当，内容完整，有效应对辩解、翻供、翻证，正确对待辩护人发问，案件量大、被告人人数多，涉及罪名、事实多；

举证，方式合理得当，条理清晰、层次分明，紧紧围绕指控事实、证明有力，运用多媒体示证效果良好；

质证，目的明确、重点突出，理由充分、逻辑严谨；

出庭意见，紧密集合案情和出庭情况，充分阐述指控一件，取得良好法庭效果，起到法制宣传作用；

辩论，要点突出、针对性强，功底扎实、理论性强，深入浅出、说理性强，案件复杂、辩点多、难度大；

综合表现，庭审时其他的表现情况。

为了简化打分方式，采用五星计量法，可以打1-5星，还可以打半星，在一个10分的维度上，如果可以打半星那就是精确到1分的颗粒度，20分的维度上，至少也可以精确到2分的颗粒度。总体来说，虽然评分较为简便，但可以精确的颗粒度还是比较精细的，可以精细化的表达对一次观摩庭的认可度。

以3人旁听为例，如果每人均打80分，就成为一个0.8%的系数，0.8%这个系数乘以3分的基准分，那出庭公诉人的最终得分就是2.4分。这是一个最普通的算法。

如果旁听的人员在4人以上，那就没多1个人，基准分就可以增加0.5分，如9人旁听，基准分就是3分，再加上额外的6人乘以0.5，也就是9人旁听的观摩庭的基准分是6分。

为什么旁听人数多，基准分要增加呢？

这是因为旁听人数多，公诉人的心理压力自然大，其准备的充分程度自然也更强，其得到的锻炼也更多。

而且之所以能有那么多人进行旁听，一定说明这个庭本身的复杂度也比较高，可看性会比较强，也就是这个出庭的难度系数本身就比一般的庭审要大。这样复杂的有难度有压力的庭出下来收获自然也大。当然我们考虑不能让旁听人数影响基准分过大，因此我们将增加一个人头只限定增加0.5分，避免开一个全市的大观摩庭分值就加够了的情况出现。

我们认为出庭还是一个日积月累的工程，不可能毕其功于一役。

我们之所以采用旁听人数来衡量出庭难度系数和经验值基础分值，难以因为我们也没有更好的方式可以公允的、简便的计算出出庭的难度系数。我们也知道旁听的人多未必一定就说明出庭难度一定就大，而旁听人少也未必难度一定就小。

但是还有什么其他更好的方法来衡量复杂性吗？复杂性本身就非常的复杂，影响的因子非常多，衡量起来也非常具有主观性。

所谓难者亦易矣，易者亦难矣。难易是个相对的概念，高手觉得很多复杂庭也没什么，而新手觉得很多庭都很复杂。如果你让他们自己填难度系数就很难有一个统一的标准，而对他们自报的难易系数就合适吧，就需要实际的审查案件，那就要耗费极大的精力和成本，而我们建立系统的目的就是希望节约成本、提高效率，以最小的收入和成本付出，支撑最大量的庭审观摩和经验分享。因此这种方法显然是不可行的。

最终我们考虑使用观摩人数也就是上座率这个简单的衡量标准。我们觉得这个标准不能说是绝对公平准确的，但它确实简单易行，且也最接近难度系数的真实水平的。因为你不可能用一个很简单的庭吸引那么多人来，而且我们这个可以是自愿来的，不是通过行政命令组织的。如果你感用一个小庭骗来那么多观众的话，那你信用就破产了。而出庭信息发布是要写出庭看点的，是可以阅览到起诉书的，其实你也骗不来观众。

骗也只能骗一次，哄人家友情出场也顶多一两次，但我们的经验值累积是日常性的，是常年的，不是一两场观摩庭定胜负的。因此，从长期来，要么你的庭真好，要么你真有水平，你才有可能招揽到回头客，才会有那么多的人慕名来听的庭。

从这个意义上来说，你能招的人多，那往往就意味着你真的有水平，你的庭别人爱看。听了一次觉得好看，才会下次再来，才会传出口碑，才会口口相传的吸引更多的人过来。

因此，看起来我们只是用观摩人数这个简单的数值来衡量基准分，但其实还是很说明问题的。而且这个基准分的增加也不是就一定能够全拿到。还要看你出得到底怎么样，还要看旁听人员怎么给你打分，这个打分构成了一个系数，调节着难度系数和完成度的关系。也就是庭不仅要难出，还要出得好才能得高分。

而出难出的庭，还能出得好，显然出庭的经验必然有一个比较大的提升，在出庭系统中相应的就是经验值的提升。

因此出庭经验值这个虚拟数值是不断向出庭经验这个真实能力状态不断靠拢的。短期内未必能看出来什么，但是时间长了，大家出的观摩庭都多了起来，那这个经验值就会越来越接近于真实的出庭能力。因此，我们只要调动公诉人的热情提升的出庭经验值越来越高，真实的出庭能力也必然越来越高，这实际上就是通过大数据在驱动能力提升。

当然我们出庭经验值并没有完全只限定在出庭这一个行为上。而且如果只给出庭的公诉人加分的话，而旁听人员不加分的话，那谁会白来呢？这也是一个很现实的问题。如果你摆好了出庭架势，但没人捧场的话，这个系统也运转不起来。

而且从真实的情景下，有同行旁听和没同行旁听的出庭效果，认真程度也必然不一样。

当然我们考虑给旁听人员加分，也不仅仅是为了有人捧场那么简单。

虽然出庭是一个实践性的艺术，需要在练中学，但是旁听的学习本身也是有收获的。而且很多年轻的公诉人，他接触的案件范围非常有限，而且身边也未必有专家型的公诉人可以学习，这些领军型的人才往往扎堆，都集中在城区院和分院，很多远郊区院的年轻人想学也学不到。而如果让他们多听听这些好庭，跟着这些厉害的师傅多学一学，那自然能够开阔视野，掌握一些新的技巧和方法，对出庭经验的增长也是大有毗益的。

而且在现场旁听庭审，是非常严肃的一件事，是不能随意走动和玩手机的，其实比参加培养班可能还要严肃认真一些，这样集中的学习经历就成为一种沉浸性的学习体验，必然有所收获。而且这个观摩庭是自己根据兴趣和时间报的，有的要驱车上百公里，必然是有很强的学习意愿，如果不认真听都对不起自己啊。

因此这种预约旁听的过程也成为一种筛选机制，真正能来的一定都是真想学的，而且自己选的往往又是自己爱学的，兴趣、意愿与现场严肃的氛围叠加，必然会产生比较强的学习效果。

因此给旁听庭审加一点经验值也是不为过的。但是我们也必须承认，旁听所获得的经验值提升与出庭所获得的经验值提升那是不可同日而语的，因此我们将旁听庭审的经验值设计为1，也就是出庭基准分的三分之一。

这个对比虽然不严格，也未必有十分充分的实证依据，但至少体现了两者的显著区别。而且出庭可以随着旁听人数的增加，而使基准分不断提高，这就与旁听经验值拉开的差距更大一些，也体现了出庭所获的经验的重要性。

出了出庭和旁听之外，总结出庭的经验，我们也认为是一种出庭经验提升方式。也就是把出庭经验写出来，也不仅是写出来，而且还要被同行认可才算数。

因此出庭经验分享的经验值提升采取的是点赞数积分方式，光写出来还不能得分，要看有多少人认同你，你得多少经验值。当然此种经验的增长与出庭、旁听相比就显得更加没有那么直接，因此我们我们设计了一个比较小的增长量。

也就是简单的出庭文字评论，点赞数每增加1个，则增加0.1分，如果将出庭经验更加系统化一些，总结为出庭百科，因为其贡献更大，而且通过总结自己提升的可能性更大，因此也赋予其更大的加分几率，也就是每个点赞数可以增加0.2分。

也就是通过系统总结一条出庭百科，如果获得10个点赞数的话，也可以获得2分，也就是与旁听两个庭审差不多，比出一个小庭小一点。但其实点赞数是比较难的，我们的点赞数放弃使用手势，而是用汉字写上赞同这两个字，因此大家在点击是非常慎重的。

很多出庭百科可能也就是一两个赞，想要被赞同的多，那一定是非常系统的总结，而且对大家帮助比较大的经验内容。而如果能够总结出如此到位的出庭经验，可见自己的出庭经验也必然得到了很强的系统化，而且对整个公诉人队伍都有一个比较大的帮助，这些经验可以在出庭百科馆里永远的保留下去，成为一代一代公诉人的出庭经验宝库。从这个意义上来说，给系统出庭经验加分也是十分必要的。

因此，我们实际上是从出庭、旁听、出庭经验总结分享等三个维度为出庭经验进行量化，从而从一个立体的维度构建了出庭经验成长的基本渠道，也是衡量出庭经验的基本标尺。

3.如何打破信息孤岛和行政壁垒

以往的出庭观摩需要很强的行政命令来组织，要么是市院安排的全市观摩庭，这种庭我们上班十多年也没遇到几次。每次都要发全市的通知，组织大家报名，安排车辆，召开总结会，发新闻简报等一堆事。

而出庭单位这块，还要协调法院安排大法庭，最重要的是一定要挑一个合适的庭，既要有点意思，有点印象，有点辩点，但也要保证庭审可控，避免突发意外情况出现，更不能让公诉人招架不住的情况出现，那就不是在开观摩庭了，变成丢人现眼了，那是绝对不行的。

为了保证这种万无一失，有些单位甚至还会提前安排裁判，还要为会务保障工作做好及其周密的准备，经常是变成全体动员。

这种巨大的行政成本导致，这种大观摩庭很难开起来，谁听了谁头疼。

而且你别看这个庭准备得这么累这么费劲，在组织报名的时候，还好多人不愿意去，他们往往说自己忙着结案，好像并不领情于组织单位的劳心费神。

这一是因为这个庭可能真的不是他感兴趣的，是你们经验挑选的，但不是他经验挑选的；二是他知道从这个庭他学不到什么真东西，根本不会有太多发挥的东西，全都是提前准备好了，就像开会一样，缺少庭审所必要的不确定性；三是这么多领导去，根本就没法说话，在开总结会的时候，说也不好，听别人说又没劲，所以索性就躲开不去吧。这就是一些人的真实心态。

如果说全市的大观摩庭不好看没意思。那能不能自己挑一些有意思外院或者本院的庭来听呢？

但这其实是极其困难的，你还以为这是看电影呐？

当时我在基层院，我就沟通过这个事，这是非常费劲的。人家一般都不是很乐意，经过层层领导沟通，最后实在没办法，才给你一个没什么争议的庭看看。

有争议的庭能给你看么？万一露怯怎么办，传出去能好么？

事实上，公诉人的潜规则就是不互相听对方的庭，因为怕自己的问题暴露了。因为经常有准备不充分的时候，经常有应对不到位的时候，这些东西不看见则已，看见了就会留下不好的印象。

而且每个人都可能有，如果没有同行在，自己的庭审效果，自己怎么说怎么是，如果有人在自己就不好说了。而如果每一个都准备得那么认真的话，又感觉太累了。毕竟感觉工作的重心不在庭审，大量的还是在庭前，还是在审查报告上边，还是在给领导汇报上边，所以总体上对出庭投入不足。这也是因为出庭效果在整个办案效果中的占比较小，很多领导也不回去旁听庭审，根本没有那个精力。

而你要旁听庭审就像是在打破禁忌，人家还得为你专门准备，你是谁啊，凭什么？这就是对方的心态。这又不是上级领导的专门安排，你不过是想过来取取经，对人家来说确是如临大敌。

因此，如果没有领导安排，本部门的公诉人之间也不会旁听对方的庭审。如果是师傅带徒弟的话，那直接一起出庭就行了，也不存在旁听的问题。而其他的公诉人之间往往抱着井水不犯河水的心态，而互相在法庭之间不串门。

跨院更更是复杂了，这要进行层层沟通的，至少是部门负责人之间沟通，很多还需要主管之间沟通，甚至上级院帮助协调，感觉旁听一个庭审要求好多人，感觉心累。索性几句算了，不旁听不就行了么？这就是观摩庭越来越少的原因。出了应付上级院检查之外，很少有人组织什么观摩庭，把大家搞得那么累，又有什么意义呢，毕竟没有那么多人把出庭当回事，在业务评比中分量无足轻重。业务评比如果比的话，比也是辩论，而不是出庭，所以更多的人忙着打辩论，而不是忙着出庭或者观摩庭审。

但是我们知道庭审实质化的背景下，庭审越来越不是可有可无的了，往往是要决定案件成败的，而且关注检察机关的公信力和整体形象的。但是我们也知道好的公诉人和好的庭审存在一个严重的分布不均匀的问题，有的地方就老是出公诉标兵，出专家型的公诉人，那很多地方就一直没有。

这是因为出庭的经验是高度个人化的，只有这个公诉人周围的有限几个人能够学到，其他人根本没机会学，因为你都听不到他的庭，你怎么学？

而有些好案子，好庭，也是这一波公诉人知道，经历了，看见了，其他人只能看新闻报道，但是这些梗概性的信息是学不到出庭经验的。

在偏远一点的院，即使年轻人有意愿，有决心，想好好学点出庭经验，也没有地方学，没有门路学，没有好师傅带。

而出优秀公诉人的地方，优秀公诉人的作用也未必完全发挥出来，等到优秀公诉人一走，这个经验也被带走了，其他人什么也没学到。

到头来，一旦遇到复杂、疑难的案件，碰到大庭不好出的庭，现学也是来不及的，出庭经验也是台上一分钟，台下十年功的事，不从一开始就点滴的积累是根本不行的。

而且现在复杂敏感的案件，呈现出一种扩散性的趋势，不是集中在一小部分地方了，而且哪个地方都可能出现，哪个院都需要有一两个领军人才来支撑。最好是能够使每一个公诉人的出庭水平都有一个整体的提高，这样才能避免一些普通的庭审，由于在法庭上说错话，导致舆情，变成敏感的案件。

为了解决出庭经验条块分隔，壁垒森严的问题，实际上就是要通过大数据的方式来打破壁垒。

通过大数据的出庭系统，让公诉人尽量的把自己的庭拿到平台上来发布，发布自后每一个人都可以相互预约，就想买电影票一样那么容易的预约到自己心仪的一场庭审。在这其中完全不需要层层沟通，打招呼。一个招呼都不用打，就把庭听完了，而且有那么多的庭审共自己选择，这是原来所不敢想象的。

要说简单，原理也非常的简单。那就是给公诉人以积分为汇报，出庭可以有经验值啊，而且旁听的人数越多，基准分也越高。为了得到高分就要多发布庭审，多发布旁听席位。这样自己的获得经验值也就越来越多。根据这个经验值的排名就会越来越高。

不为别的，为了这些经验值也是值得发布的。这就是趋利避害的效应。

有人就会问了，这个时候怎么不担心露怯了？

其实还是担心，为了这份担心，就只能默默认真准备呗，多准备一点，也就少露怯一点，给大家的印象留得好一点。而且只要出庭就有分，并不会加负分。即使一开始庭出的紧张，不够好，旁听人员打分不一定很好，但总会有一个大致的分值，也就是多少还是有的赚的。

这样以来出庭就变得“有利可图”，就变得有意义了，即使依然不能在业务评比中占多大比重，但也有了独立价值。因为这个平台可以单独排榜单，在这个榜单能够排名靠前，不也是一种光荣么？

而且发布的庭多了，大家都在发布，出的观摩庭越来越多以后，也就放下顾虑了。也不用无比重视的刻意准备了，只要按照日常的准备，稍微认真准备一点就行了。我给大家看的就是一种日常表现，而不是一年到头来一个观摩庭的表演型出庭，而是自然的、日常水准的出庭。

大家觉得好，就多打几分，觉得不好，打的分少了，也没关系，下次再来呗。反正要发布的庭多的是，谁也就不在意一城一池的得失了，大家的心态就放平了。只要你每一次都认真准备，即使一开始紧张，慢慢的也就不紧张，即使一开始应对的不好，但慢慢的也就从实践中掌握了技巧，这样以来经验值必然越来越高，而出庭能力也必然随着经验值的不断提升而实实在在的增长。

通过全市运行出庭能力培养平台之后，那么组织观摩庭就从一个组织行为，变成了一个个人行为，个人发布，个人与法庭协调与旁听人员对接，出庭人员和旁听人员都是在出庭能力培养平台上，完成一系列的发布、预约、评价等功能，期间完全不需要部门之间的协调，耗费的行政组织成本和沟通成本趋近于零。

也就是通过大数据的方式打破了行政壁垒，从原来的出庭经验这些数据孤岛链接起来，可以通过算法的方式，实现任意的组织联系，实现在全市范围内可以自由发布出庭信息，进行预约观摩，只要有出庭经验分享欲望和需求的人都可以在这个系统中实现自我的提升。大数据和算法成为打破行政壁垒、链接数据孤岛的主要方法。

4.如何调动人的持续热情

人是有荣誉感的，因为人是一种社会动物，渴望受到同类认可。人是通过实现社会价值来实现自我价值。

但是这种认可，需要一定的载体。我们就是创造了这样一个载体和一系列的规则，让每一份对出庭经验的贡献都会得到相应的经验值回报，包括出庭、旁听、点评和出庭百科的撰写。

通过这种激励，既实现了个人出庭经验的积累，也实现了出庭经验的共享，这也是共享经济的原理。

不仅仅是汽车、自行车、房屋可以共享，经验知识更加可以共享，通过出席法庭这个平台，这种体验也可以实现共享。

付出就有收获，付出多少就能收获多少，多劳多得，少劳少得，经验值也要按劳分配，这种分配不仅体现在数量层面，还体现在质量层面。因为，出庭经验要以旁听人数和评价高低计算出庭分数，点评意见和出庭百科要以赞同数来计算分值。

我们就是要鼓励高质量的出庭经验积累，越是用心收获就越大，在数量的基础上又进一步提高质量，实现经验积累模式的升级。这就是形成了基本的激励机制。

但最重要的一点还是要能够做到立即兑现，这就是虚拟世界最吸引人的地方之一。现实世界往往需要复杂的规则和等待，这样虽然最终也会有收获，但等待时间越长获得感就越少，相反等待时间越短获得感就越长。

通过虚拟平台可以实现获得感的最大化。虽然，这些荣誉与现实的荣誉相比，没有那么大的影响力，但是由于给付的足够快从而得到了弥补获得感的不足。

而且其实所谓荣誉本身就是一个抽象的东西，无论是线上的还是线下的，只要你在意它，它就重要，越多的人在意它，它就越加重要，也越加有影响力。荣誉本质上还是一种认可。除了经验值，我们还打造了一系列的徽章体系和排名体系，荣誉最终还是要通过比较实现的。

人都有分别心，就是要比个高下，只要规则透明，竞争就是公平的，竞争的结果就会被广泛认可。

人类就是在竞争中获得进化的，公诉人也只有在竞争中才能实现自我迭代，通过比较发现不足，通过比较挖掘潜力，通过比较还可以获得荣誉和认可。

但是竞争要先有有规则，规则就是一系列的算法，我们侧重将经验值激励放在出庭领域，单次出庭获得的经验值自然要远高于旁听和撰写出庭经验，因为最终还是要提高出庭能力，我们鼓励学，但我们更鼓励做。

但是学等足够多，撰写出庭经验足够多，也可以获得很多经验值，因为它还可以向更多人分享，不仅使得自己收益，也使得大家收益，从总体上增加出庭经验。

出庭能力不能自己提高就完了，还要能够又有助于整体提高，因此这些我们也要激励。我们重点是通过算法防止人为的刷经验值，使经验值反映真实付出，为此我们设计了很多精妙的规则。而且这些规则都会提前公布，每一个人都可以了解，都可以根据规则对自己的行为做出预判，对自己的工作学习做出规划。

由于这些经验值汇集的排名也是实时的，这就形成了公开透明的竞争机制，你知道别人怎么超过你的，你也知道怎么可以超过他，在竞争过程中必然形成一定的压力氛围，从而调动最广大公诉人的最大热情投入其中，无论你最终的排名如何，总体上都会有所提高。但是为了排名靠前，付出必然更多，收获也必然更大。

由于出庭系统的评价是每名公诉人日常的、大量案件的、长时间尺度的评价，与单个的出庭录像评审相比，显然更加能够反映公诉人的真实水平。

由于引入了公诉人相互的点评机制，确实在出庭现场实时观摩，且其点评内容还要接受其他同行的审视，评价机制也必然更加的公开透明和公允，我们已经将出庭能力培养平台的经验值作为优公评选中出庭能力部分的分值参考，并专门组织了优秀出庭公诉人和优秀示范庭的评比活动，实现了荣誉体系中虚拟与现实，线上与线下的结合。

以此为导向，也可进一步激励公诉人积极做好日常出庭工作，从而使优公评选与日常办案结合得更加紧密，进而更加有利于促进出庭质量和办案质量的提高，也使优公评选机制的权威性和公认度进一步提高。

出庭能力培养平台是大数据思维和算法思维在出庭管理工作的实际运用。更加尊重每一个个体，通过大量个案的观摩点评回复讨论，使公诉人个人的真实能力得到确认；通过对每个个案的讨论交流，借助网络打破地域、信息壁垒，更好的整合共享出庭经验成果；通过各个环节的经验值激励和排名机制，以及优公评选的外部确认，创造系统内部的自我激励机制，增强公诉人的竞争意识，促进刑事检察队伍整体水平的提高。

应用大数据思维，我们得到了更好的公诉人。

第八章：大数据怎么自己动起来？

我们可以用行为采集数据，使数据成为副产品。虽然说这个数据是副产品但并不是说它不重要。相反它是非常重要的，它能够反应出庭经验累积和出庭能力提升的总体面貌及其不均衡性。而这种数据的排列结果，比如排名，还可以刺激其他公诉人不断的投入其中，已经投入进来的会更加投入，从而进一步加快出庭能力的提升速度。

当虚拟的经验值与实际的出庭经验不断趋同的时候，我们知道我们驱动的出庭大数据实际上就是提升整体出庭能力，这是一个出庭能力整体加速迭代的过程。

但是我们要问的是，这个过程能够持续下去吗？时间长了会不会疲惫，持续推进的动力源何在，我们应该如何维系？

我们更要问的是这些数据真的代表能力提升么，出庭大数据对真实的出庭能力提升到底有多大的帮助？

1.如何降低管理成本

我们知道现实的出庭观摩活动是极为消耗行政成本的。我们设计的出庭能力培养平台就是要尽量的降低行政出庭成本。

具体怎么降低？

那就是由原来的组织性发布，变为自主型发布。原来是本院本部门或者上级院上级部门发布了一个庭审观摩通知，然后协调各方进行组织。

现在简单了，由公诉人自己发布出庭信息，就在这个系统上自己发布，这样组织者就不用发布了。

虽然发布人由组织者变为公诉人，但是发布的复杂程度是不是一样的？也就是这个麻烦是不是只是由组织者转嫁给公诉人？

并不是。

出庭能力培养平台通过与办案系统关联的方式将发布方式极大的简化了。公诉人只要输入案号就可以通过出庭能力培养平台自动关联统一办案系统的相关办案信息，相关信息就会自动导入进来，只用填写出庭时间、时长、法庭等少量信息即可。就连公诉人的联系方式也已经预制在系统之中，而无需填录，然后选择一下出庭席位数量即可。

其实公诉人需要写一点字的主要就是出庭看点，这个看点是介绍这个庭审的特点、复杂性和新颖性，也就是可看性，从而吸引观摩人员过来预约。

基本来说可以实现一键发布的效果，为了吸引多一点人来，而多写几句的出庭看点，大家也是能够接受的。事实上，在庭审发布量日益增多的情况下，多写几句出庭看点绝对是有巨大竞争优势的。

也就是通过信息化的手段对庭审发布进行了流程再造，或者说是格式化，这样一来可要比组织者的发布方式要简单多了。

关键是沟通起来相对简单，上级组织的大观摩庭往往是人员众多，场地大，人员来源广泛，沟通协调起来颇为复杂，行政成本高。

而目前出庭能力培养平台日常发布的庭审实际上是化整为零的，很少有几十人上百人那种大型观摩庭。往往是三五个人，就我个人的经验来说，一般在七个人之内与法官都比较好沟通。但这主要看各家法院经常使用的法庭实际容量。但一般来说，邀请三个人怎么着也坐下了。

这样一来公诉人在观摩协调过程中也比较简便，只要与审判长沟通一下就行了，一般也都没有问题，也不需要额外的提升沟通层级，这种沟通成本就相对较低。

还有一块的沟通成本就是观摩人来旁听时的沟通成本。我们的系统会预留公诉人和观摩人的电话，这样只要预约成功，联系方式彼此就能看见。这样一来只要在开庭前确认一下在哪里集合怎么进入法庭就可以了。

而且这种私下里的观摩活动也没有必要一定要举行什么总结会，大家在开完庭之后，在闲聊的过程中就把真实的意见说了。

这些私下里的意见往往是最真实，最有参考价值的，在很多人的场合反而不太放得开了。

我们也知道即使在网上的评价中，大家给差评，给很低评价的几率也很低，因为毕竟都是一个系统的同事，低头不见抬头见，因此评分差距并不容易拉开，只是靠累积的出庭数量，靠回头率、靠吸引的旁听人数多少来更加真实的体现能力的高低。

而真正要想听到真话的就是这些少人的、私下的场合，这些不经意的交流，才是最坦诚，也是最有帮助的。

而且这样也可以让公诉人之间增进了解，从原来相对封闭的在一个地域履行公务或者偶然在培训开会的时候才能认识一下，变为可以经常性的见一下面，与其他公诉人进行交流。

而如果你是一个年轻人的话，你可以有选择的与更多优秀的前辈进行交流，不管他在哪个院，他认不认识你，你都可以向他们直接学习，直接结识他们。

而对于出庭的公诉人以往是很少有人对你的庭审有什么反馈的，辩护人不会说什么，法官熟悉了，也知道你的风格了也没什么可说的，你更是没有机会听到被告人对你出庭情况的反馈，你也不太可能与旁听席的观众进行交流。

而现在只要你把庭审发布出来，有人预约，就会由一些同行认认真真的听完你的整场庭审，还会认真的给你提出意见。即使他表达得不多，但你能够从他们的眼神和情绪中有所体会。

这些同行是跟你过来的，也会跟你离开，他们会跟你进行交流。而且作为旁听者的角色也让他们觉得有义务与你进行交流，因为他们回去还要写评价。

而且人们对于亲身参与过的事情，是很愿意进行分享交流的，而同行之间又比较能够交流起来，对于一些专业性的问题，大家都有很强的好奇心，这些好奇心支撑起交流的欲望。而且没有领导在场，也更加可以畅所欲言，就像朋友一样的聊天吧，其实也是很有趣的一件事。

因为这些交流，甚至会使他们彼此成为朋友，至少加一个微信，从而可以建立更加长久紧密的联系。

而这些联系的增多就会使公诉经验的交流之网建立起来，也促进出庭经验交流统一市场的建立和稳固。而这些的稳固，也就会带来了出庭数据的稳定增长。

而出庭数据的稳定增长又会带来推动公诉人更加持续的投入，从而形成一种良性的循环。

这是出庭公诉人这一边的心理。

对于观摩人这一方，他们的学习变得更加容易了，就像买一张电影票一样可以方便的预约一场庭审，这在以前是不敢想象的。

而且种类繁多，可以有很多选择，在全市范围内都可以预约，不用跟领导打招呼。

当然了请假可能是一个问题，经常旁听到处跑，领导还会以为你不务正业怎么办？

为此，我们专门设计了一种预约的确认函，并也提出了要求，对于这种旁听预约的行为一律视为与出庭、提讯相当的工作行为，不用额外的请假，这样一来就打消了一些后顾之忧。

还有一种误解认为，这么老远谁会跑过来旁听啊？真的会有人用么，年轻人有这么愿意学习吗？好像有一些培训最后都没人愿意去吧。

有些培训没人愿意去这确实是事实，但是要说年轻人不愿意学习这是一种巨大的误解。

年轻人不是不愿意学习，而是没有合适的内容让他们选择。

他们需要的是丰富性，可选择性，时间还能够自主把握，他们不喜欢被动的强迫和安排。

但是这种丰富性和可选择性在传统的观摩庭组织模式中是无法实现的。

因为这两端都有极大量的数据，工作量太大了。

传统上发布一个观摩庭必须要提前很长时间做准备，因此必须精挑细选，提前准备好。

但是我们知道日常的出庭通知给不了你那么长的时间，在比较短的时间内，发布通知，让人家报名是来不及的。尤其是出庭也经常有变数，可能因为法官的原因或者辩护人的原因就开不了了。

这样一来，之前发布的庭审信息就全白费了，再改实在是来不及，而且一下子就涉及到全市范围，动静也太大了。

因为成本高所以组织的观摩庭就少，这样一来多样性的需求就无法满足，也就产生了不愿意来的问题。

而出庭系统就是通过大数据的方式将两端海量的数据进行动态匹配，每天在出庭系统上都有很多出庭信息进行发布，而其他公诉人只要浏览这些信息就够了，看到有意思的，自己感兴趣且时间也合适的化，就预约下来。

虽然每个人只是进行发布、浏览和预约这些简单的动作，但是成百上千次的动作之后，就实现了出庭和观摩海量数据的对接，这些对接在瞬间完成，而不需要繁琐的报送、汇总信息和通知这些复杂过程。

因此预约变得容易多了，也方便多了，关键是多样性和自主性的提升，极大的满足了年轻公诉人的学习欲望，也增加了他们对出庭观摩这项活动的参与感。

我自己就发布过二十多场观摩庭，每次都是六七个席位，很多时候都预约满了，旁听我出庭的有自己部门的，其他刑检部门的，案管部门的，综合部门的都有，还有分院和基层院的同事。

我记得有一个庭是9点半开，有两个远郊的，当时还来晚了，快到9：20才过来，差点没进来，说是早上7点出来的，早饭都没吃，开了一百多公里，路上堵车了。开完庭之后，我也说去吃点工作餐吧，她俩还说下午还有事，午饭也没吃又杀回去了。

就为了听一个庭，你说容易么？

是谁强迫她们来么，是领导安排她们来的么，都没有，是真实的学习欲望支撑他们这样去学习，也是他们自主的选择让我们不由自主的要兑现学习承诺，所以从他们身上，我相信年轻人是有学习欲望的。而数据也证实了这一点，年均旁听人次达2000余次，与观摩庭数一样，也是量级的提升。

2.如何兼顾效率和公正

出庭观摩信息的发布和预约都变得容易，效率也提高了很多，但有一个问题也出现了，大家这种完全自发的组织观摩，在评价标准上会不会产生过于随意的问题。看到自己熟悉的就打高分，看到不熟悉、不喜欢的就打低分。

传统的出庭观摩组织形式虽然有僵化、成本高的问题，但毕竟相对来说比较权威，有一种引导性，虽然很多拿出的观摩庭有摆拍和彩排过的味道，真正的问题也很难看到。

但是权威性和引导性也是需要的，这个在这种自组织的模式尤其需要。

但是这种权威的引导是成本很高的组织行为，比如抽调刑事检察的业务专家去旁听庭审，每次都需要大量的沟通协调，而且这些专家一般都担任了一定的领导职务，也承担了很多复杂疑难的案件，能够抽出来的时间也很有限，能够凑齐就更难了。这也是原来跟庭考核的规模上不上去的原因，因为专家没时间，专家太难请了。

原来每年二十场都这么难，现在每年一千场兼职是难以想象的。但是我们觉得完全可以换一个思路，为什么要命令专家去干这个事呢，为什么不能让他自愿去做这件事。就像公诉人自愿的发布观摩庭、自愿的进行预约一样，为什么不能让专家也自愿去进行跟庭考核？

而且为什么要让好几名专家都聚在一起听一个庭，如果要引导的话，完全没有必要这么多人，只要有一名专家就够了。这样可以让专家分散开来，用有限的专家资源影响更多的庭，从而让专家引导的覆盖面变大。

而且没有必要把跟庭考核这个事一定要当做一个任务，为什么不让它成为一项荣誉呢，让那些有意愿的人来干这个事该多好。

而且所谓的专家我们也应该放开视野，也未必一定是部门领导或者十佳公诉人，那些在出庭能力培养平台上经验值积分靠前的，已经展现了实力的公诉人，如果其有意愿完全可以担任这样的角色。

也就是这个专家的角色不是非谁不可的，应该是开放性，甚至是有一些竞争性的。如果不能完成带头观摩引导的任务，也就没有让其继续担任的必要了。

这样一来，我们在系统中设计了点评专家这个角色来参与管理，由其来把握庭审点评的方向，带头出观摩庭、带头旁听观摩庭、带头进行点评，成为出庭工作的行业引领者。

第一轮主要是邀请资深公诉人担任，包括很多部门负责人，大概由四十多个人。

点评专家就是为普通公诉人的点评作出示范和表率，他们的点评会被置顶，他们的预约不受限制，但每次观摩庭只能有一个点评专家出现，从而保证点评专家能够参与更多的庭审。

点评专家也有自己的任务，每人每年要出一个示范庭，旁听庭审不能少于5次，其中2次必须是外单位的，从而保证点评专家可以在更广的范围进行交流。

如果有些点评专家一年下来没有完成基本任务，将被自动取消点评专家资格，由排名靠前的检察官替补。从而保证点评专家始终保持最高的水准和积极性。也就是出庭观摩工作始终由一些最优秀也由意愿的人来掌舵。

这样既能保证出庭点评的公允性和方向性，也能够保证点评专家的积极性，让这种引领能够实打实的进行。

我们初步计算了一下，只要40名点评专家都能够完成任务的话，就会有200场观摩庭有点评专家跟着，即使是每年一千场的规模，至少也有五分之一是有点评专家参与的，而且点评专家愿意去的一般可能还是复杂一点的庭审，这样一来对于整个出庭观摩工作中就可以产生相当程度的引领性。

每一场庭审都有专家参与也是没有必要的，只有经常的可以看到专家，经常的能够得到专家引导，就可以产生正面影响和辐射作用。

尤其是在点评专家呈现竞争上岗的机制之后，很多有志者都可能轮番担任过点评专家了，这样一来通过出庭观摩比较的实践锻炼，具有点评专家能力的公诉人就会渐渐多起来。虽然我们的点评专家在岗人数是有限的，但是达到相当水准的人会越来越多，这些人在旁听其他人庭审的时候，其点评水准也会随之提高，这样一来能够受到专业引导的庭审就远远不限于200场，会越来越多，从而产生逐渐提升整体的庭审观摩水平的效果。这就是一种效率与公正的动态平衡。

通过有限的点评专家资源，通过开放动态的竞争机制，逐步扩大了专业引领的队伍。也就是即使初始化资源和水平比较低，只要持续不断的通过算法刺激和积累，也能够提升整体水平，从而实现指数级的增长。

虽然出庭能力培养平台伴随着出庭经验值的提升，理论上就会产生出庭能力的水涨船高。但是与所有的大数据平台一样，我们也要警惕利用平台“刷经验值”冲排名榜单的不当竞争出现，这个在系统设计之初我们就预见到了，并预防性的设计了一些信用算法，也就是确保诚信的算法。

可以预见到，随着出庭能力培养平台关注度的增加，排名靠前的公诉人得到领导关注和认可的几率就会增加，也就有可能会真实世界的名与利的回报。当然这也是这个平台的意义，只有同行广泛的认可，真的把这个排名和积分当回事，公诉人才会前仆后继的不断投入的出庭观摩工作之中，从而去打磨自己的出庭能力，这是真实的人性动力，从正面来说这也是荣誉感的体现。

但是荣誉和利益面前，如果规则不健全，有些人就钻孔子，因此平台在初期也在不断进行有针对性的完善。

比如部门和单位内部的刷分问题，这既有熟人帮忙问题，也有单位急功近利的组织性行为。

比如有人为了提高积分，但又不愿意组织那么多的观摩庭，就有可能让熟人帮助约上自己的庭，去不去没关系，但尽量都可以打高分。这就形成一种不劳而获的效果。

但是熟人帮忙也有局限性，就是没有人那么多人会陪你玩，老在网上帮你打卡，打几回就打腻歪了，不但对你的人品产生质疑，而且也会失去耐心。

这样一来，其实求人帮忙刷分其实很难的，也根本刷不了多少分。在平台竞争比较充分激烈的情况下，几乎没有什么用，虽然可以增加一点分，但这点分数几乎很难进入前十的排名，这样一来就根本得不到所谓的名与利的回报。

比较厉害的有组织的刷分，比如部门或者单位的领导有要求，指定大家都给一个人刷分，从而确保本单位的“种子选手”在排名中能够脱颖而出。

因为刷分毕竟不是什么光彩的事，真正愿意配合的人肯定是有限的，但显然要比个人的能量大，效果也会更明显。

但是我们也注意到，真正能够产生有组织刷分的，还是在部门和单位内部，很少有人有那种影响力，让全市范围的公诉人给自己刷分。如果他真的有这种影响力，他完全靠真实出庭就够了，也就没有刷分的必要了，而且声誉也是影响力的重要因素。

针对这些情况，我们主要针对单位内部熟人圈子设计了一个防刷分算法。

也就是对预约观摩庭审的熟人限制，即每个月，对同一公诉人预约庭审数不得超过2次。每年，对本院同一公诉人预约庭审数不得超过3次。

也就是说你可以在跨院预约，也可以进行本单位预约，但你不能可着一个人预约不停，这种可着一个人预约不停的行为，我们认为具有高度的刷分嫌疑，因此予以了限制。

为什么我们不能通过实地检查的方式防止这种刷分的情况出现呢？

这是因为线下人工管理的成本太高了，我们就是因为节约行政成本来走了大数据线上预约这条路，当然不可能再走回头路。而且面对每年上千个观摩庭，数千次的海量预约，想要进行线下人工监督也是不可能的。

因此，我们能够做到最好的方式，也是唯一的方式，就是通过数学算法，通过逻辑的方式填补漏洞，这也是最经济高效的方式。

当然在运行中我们还发现，虽然刷分的主要动力来自于本单位、本部门的熟人社会，但是其实对于全市公诉人群体来说，这个熟人社会其实并不完全限于本单位、本部门。谁在外单位没有个同学、朋友呢，因此这种跨院的小规模刷分仍然是存在的。

但是此种方式也更加难以预防，因为我们毕竟是要鼓励跨院的交流的，我们希望大家能够多走出去看看，因此我们也不能完全把这个大路堵上。

而且有些人愿意跨院际多听一下知名公诉人的庭，也是完全可以理解。

但是过多的只听一个人庭，还是高度可疑的。即使你特别喜欢一个人的庭，也不会像追星族一样，只追他一个不可。而且知名、优秀的公诉人很多，不可能只是一两个。

因此，我们对刷分算法就进一步进行了升级，对跨院际的预约进行进行了一定的限制，但这个限制要比同院的预约要轻，即对其他院同一公诉人预约庭审数不得超过5次。因为我们害怕误伤真正的学习者，另外也是因为这种个别化的熟人帮忙很难形成规模，危害要小。

这种刷分的主渠道虽然是旁听和预约，但其实对于出庭文字评价和出庭百科的点赞也可能存在一定的刷分情况，因为这也是一种次要的得分渠道，虽然是次要的，如果没有防范措施的话，也会极少程度，从而影响公正性。

这个从一开始我们就预见到了，因此出庭文字评价和出庭百科这种出庭经验总结性的经验值得分，我们并没有按照完成即得分的方式进行计算。我们是主要是按照质量进行计分，从而鼓励公诉人对经验总结进行精益求精，避免灌水。

也就是出庭文字评价和出庭百科是按照赞同数进行计分的，有多少人赞同才会计算多少分。当然因为出庭经验总结对出庭能力的提升具有间接性，我们对其分值设计得比较保守，文字评价每个赞同数得0.1分，出庭百科是每个赞同数得0.2分。考虑到公诉人基数只有几百个人，而真正关注一条文字评价和出庭百科的人相对较少，这个得分其实是很有难度的。

但也是架不住熟人老点赞，或者单位和部门组织人员点赞，这与出庭的刷分一样也是有可能的，虽然得的分要比出庭少很多，但多少也有一些。

为此，我们也借鉴了出庭防刷分的一些经验，设计了防止赞同数刷分算法，即每条文字评价或出庭百科本院内部赞同数不得超过10次。每个月，每人最多获得本院20个赞同的累计分数，最多获得特定人5个赞同的累计分数，超过则不得分。

当然我们同样也考虑跨院的刷分问题，后来也增加了跨院的防刷分算法，即每年，每人最多获得特定人20个赞同的累计分数，超过则不得分。这个特定人当然就是外院经常点赞的熟人。即使你透支友谊，每年从一个朋友身上无非只能得到2分，或者4分。

这些算法虽然不足以防止每一次“友情”点赞或者说感情分，但也可以最大限度的限制其大规模刷分，获得不当利益。当不能通过刷分的方法获得明显提升，取得不当利益之后，很多人就会知难而退，转入正常的真实的经验值增长上来。

与其刷分这么辛苦，还透支友谊，那还不如真正自己去得分，虽然累一点，但也是堂堂正正的，而且也必然是更有收获的。

刷分不仅是徒劳无功，而且我们从算法层面也让其付出很大代价，从而有可能是得不偿失的。

为此，我们还制定了未出席庭审扣分规则，即无论作为观摩人员或者作为出庭检察人员，如果未出席庭审：第一次未出席扣5分，第二次未出席扣10分，第三次未出席扣20分，每次扣分翻倍，直至经验值为0。

也就是一经发现是挂名旁听或者挂名出庭，也就是根本就没出现而想要混分的情况，一经发现则采用加倍扣分的方式进行惩罚，从而给蒙混过关者以沉重打击。

发现机制大致有四种，一是出庭人员对旁听人员到庭情况的确认；二是旁听人员对出庭人员的确认；三是点评专家对旁听人员和出庭人员的确认；四是旁听人员对其他旁听人员的相互确认。通过这几种方式可以极大的减少刷庭几率。

除了这个算法之外，我们还通过一个关系算法又进一步从制度上限制，跟着混庭的情况出现。也就是自己没案子，或者案子比较少，而在出庭发布的时候，出现出庭人员好几个人，但真实出庭的时候发现根本没有那么多。

我们设计了三个关系算法，一是只有案件承办人才能发布自己的庭审，其他人无权发布；二是承办人在发布庭审时如果要增加出庭人员的，需要该人员在系统上予以确认，避免乱挂庭的情况出现；三是增加出庭人员的，也必须相应的出庭席位，也就是既然多人出庭就意味着案件的难度系数一定更大，因此可观摩性就更强。具体来说设计了出庭人数与观摩席位关系算法，即出庭人员为1人，最低观摩席位为3人。出庭人员每增加一个检察官，最低观摩席位增加5人。出庭人员每增加一个检察官助理，最低观摩席位增加3人。

这三重关系算法就相当程度上增加了挂庭的难度，而且旁听的人多了，监督的眼睛也就多了，确认出庭人员是否齐全的可能性也就大了，而虚冒出庭所可能带来的后果将是相当严重的。这样一来，就使得刷分变得难上加难。

既然刷分不能普遍的带来不当利益，刷分也就很难形成风气，这样公平竞争的气氛慢慢就会培养起来，从而实现一种良性竞争和有序增长。

同时为了确保稳定高效的出庭和预约观摩秩序，避免随意发布，随意预约的情况发生，我们还设计了取消发布扣分规则，即取消时间>72小时，不扣分；48小时<取消时间<72小时，扣0.5分；24小时<取消时间<48小时，扣1.0分；取消时间<24小时，扣2.0分。从而在平台上避免出庭和预约行为的随意性，有利于促进预约观摩行为的有序性。

3.如何通过数据来提高真实出庭能力

大数据与算法构建的出庭能力培养平台目的还是要提高公诉人真实的出庭能力。

其实本质上就是极大的增加出庭观摩的几率，让出庭变得更有压力，让旁听的人更有收获，让出庭经验可以更大范围内的共享，让出庭经验可以被系统化的整理。

而所有这些付出都以出庭经验值的方式进行累积，并根据这些计算结果设立动态的排行榜。让以往并不被关注的出庭工作时时都能得到关注，让以往无法量化，不便衡量，因此不好评价的出庭能力，现在变得直观可视化的进行量化对比，让能力高低和增长一目了然，从而也进一步刺激对出庭的投入。

当所有人都投入的出庭、观摩，出庭能力也必然日积月累的提高。

而且尤其重要的是我们还通过信用算法的方式，最大可能的限制算法，从而使出庭经验值的含金量更高，让出庭经验值越来越接近于真实的出庭能力，从而促进出庭能力的真实提升。

这种提升真实出庭能力的其实是一套算法性的机制，一种大数据的逻辑规则，我们可以称之为一种“司法管理的自组织”。

什么叫“自组织”？一般来说，组织是指系统内的有序结构或这种有序结构的形成过程。德国理论物理学家赫尔曼·哈肯认为，从组织的进化形式来看，可以把它分为两类：他组织和自组织。如果一个系统靠外部指令而形成组织，就是他组织；如果不存在外部指令，系统按照相互默契的某种规则，各尽其责而又协调地自动地形成有序结构，就是自组织。（赫尔曼·哈肯，《协同学:大自然构成的奥秘》）

说白了也就是从要我学到我要学的转变，也就是充分发挥公诉人的主观能动性。

（1）相互作用形成博弈机制

系统虽然是围绕出庭工作展开的，但实际上是公诉人的连接，人永远是系统建构的第一纬度，概莫能外。

公诉人在这个系统上的交互碰撞、比学赶帮、添加积累才使得的这个系统建构起来，才有意义，这个系统来自于公诉人又服务于公诉人，公诉人对这个系统失去兴趣，这个系统也就失去了存在的价值。

公诉人与公诉人在这个系统中的相互作用，某种意义上就形成了博弈机制，成为推动系统的驱动力量，大致上有三层关系：

一是相互评价

出庭质量好坏，由公诉人进行同行评价。一个庭出的好坏，一个公诉人的能力到底如何，如何评价是一个大问题。

长期以来，优公评选被人诟病之处就是一定程度上形成了考试能力与实际办案能力的脱节，这一方面是由于考核成本问题，优公评选更加倾向于短时间集中的评价和测试，从而使考核模式与日常办案模式异质化；另一方面是评价机制问题，为了体现中立性和权威性，优公评选的评价者更多是专家学者，这些专家学者虽然术业专攻，但并非办案的行家里手，而且更为重要的是，由于时间关系，评价的过程中也难以深入公诉人的办案日常细节，评价过程容易浮于表面。

出庭能力培养平台可以一定程度上弥补优公评选机制的部分不足。

原因有三：一是不实际观摩庭审者，不能进行点评，点评人的点评意见还要公之于众受到监督，如果指鹿为马，恶意诽谤或者胡吹乱捧，都必然受到其他围观公诉人的批评，而如果评价中肯，言之有物反而可以受到同行称赞并能够以此获得更多的经验值激励，从而有利于实现公开透明和相互监督，促进评价公允。

二是点评人也是被点评人，点评别人成败得失的同时，自己也要拉出来练练，也只有这样才能获得更多经验值，从而实现更高的排名。因此在每一次评价他人的同时，也不禁要反躬自省，自己能否做到，这样评价是否公允。

三是长时间、大样本将降低偶然性和主观性。每个人都存在发挥失常的可能性，这在一次性考试更加明显，但是评价一个人的能力不能看一案之得失。仅从个别的庭审看，也会存在观摩者与出庭者价值观差异大，虽然出于公心但也可能背离真相的可能性，这在一次出庭、少量观摩者的评价中极容易出现。

但是如果将时间尺度放大，综合几年间数百个出庭评价的总体情况来看，这种偶然性将大大降低，就不容易看走眼，将能够更加接近于公诉人的真实水平。

相互评价是一种典型的博弈，但不是你输我赢的零和博弈，而是一种可以实现双赢或者多赢的正和博弈。就是你把别人评价低了，并不会导致你自然高，反而由于的不当评价有人把你看低，至少你不会从中获益。

但你如果你评价公允、精当、到位，对别人有启发，你会获得更多的认同，你本人就可以从这种高质量的评价而获益，那个受到你公允评价的人，当然也会从中得到他应得的收益。

在这里人们因为正直、真诚、勤奋、深刻和出色而受益，而且只是直观可见的受益，这就会对公诉人形成正向的鼓励。因此，这里的相互作用就是良性的，虽然可能很激烈，但是由于有二次评价的制约，可以保证其正向发展。

二是相互比较

无论是出庭、观摩、点评还是撰写出庭百科或者编辑出庭百科，最后都会获得经验值的回报，这些回报的综合汇总就是排名榜。

而且这个榜单是时时的，是随时变动的。我们将榜单会做成多页的模式，每页是20个人，如果是500人的话就是25页，并不是每个人都会翻开25个页面逐页查看，但至少首页是每个人都要看的，而且我们会将前三名的照片直接贴出来，再后面的排名就是名字，鼠标停在名字的上方也会现实照片，但显然前三名的照片会更引人注目，这些都是隐形的激励措施。而且排名考前的，尤其是前二十的公诉人还有望成为点评专家以及出庭百科的编辑，获得一定的管理权和名望，这些也是激励措施。

这些都将使得榜单越来越有吸引力，榜单的变动也将对这些特权产生一定的影响，因此更加牵动人心。而随着这个系统的影响力越来越大，关注度越来越高，排名靠前的公诉人还将会获得更多实实在在的晋升、提拔机会，这一切都使得人们越来越在意系统上的排名，形成一种竞争性的氛围。

而这种竞争已经不再是一个院内部的竞争，而是整个北京公诉人的相互竞争，这种竞争不再是几年一度、一朝成名的比赛，而是时时刻刻，是永无止境的竞争，长期保持领先的必然一直保持了很高的水准。为了保证新任职的公诉人可以获得公平的起点，每年都会重新进行排名，即只以本年度的新增经验值计算今年的排名，历史经验值仅供参考。

因此，每年都会产生年度公诉人，每一个新人都有上位的机会。任何人都不可能躺在功劳簿上，都要不停的办案、学习、积累才能保持现有的排名水平，而如果想要提升名次就要付出得更多。

而系统对每个人都是公平的，无论地域、天资、资历，只要付出就会有收获，一旦停止付出就面临被赶超的危险。

这是一种激烈的竞争，但这种竞争是良性的，既有利于自我提高，也有利于激发其他人的提高，最终就是整体水平的提高。这很像行业联赛，在公平竞争的环境中越激烈就越能促进整体竞技水平的提高。

三是相互促进

在评价的过程中，无论是出庭人还是观摩人都可以获得基础性的分值，但是观摩人如果想获得更多的分值就要更加认真的写评语、甚至转化为出庭百科，这个过程中意味着你要更加认真观摩、更加认真的总结出庭经验，这种评价应该是恰到好处的，切中要害的，对出庭人最有益处，成为出庭人的一面镜子，可以正衣冠、知不足，其他人也会间接受益。

而出庭人如果想多得分，就要使自己更加有吸引力、争取更靠前的排名，或者多写评价、百科增加自己分值的同时还可以扩大自己的知名度，另外就是要精心撰写出庭看点吸引人来看，来看得人越多，直接受益的人也就越多，当然出庭人获得分值就越多，这些观摩人总结的经验总数也会越多，围观的人也会更多，一个庭所可能形成的总的出庭经验受益就会实现最大化，这就叫相互促进，多方共赢。在比的过程中，也是一种相互促进。

可以预见，这个系统一定是从农村包围城市开始的，是从年轻人中先开始流行的，越是偏远的地区、信息闭塞的地区，越是对采用新技术实现信息对称有动力，而且年轻人更容易接受新鲜事务，资历浅，更加渴望学习进步，这些先行者也必将是最先的受益者，就像改革开放最先下海的一批人，他们将成为先富起来的一批人。

与其说是先富带后富，不如说是先富的行动刺激了后富者自己致富的决心。有些后富由于具有更深的资历、更丰富的经验、更大的行业影响力，在开始的时候是很容易反败为胜的。

但是这个系统的好处就是，永无停歇，资深公诉人如果满足于一时的赶超，没有持久的热情和动力，也必将被后来者超越。

实际上，所有人都应该明白，游戏规则改变了，不再是毕其功于一役的大比赛和大案件，这个游戏没有尽头，当然我们年度为单位进行一个阶段性的总结，产生年度的公诉人。

但是要想年年保持年度公诉人，就需要时时刻刻的付出，不允许任何的怠惰。

当然，也无需你在哪一个时期用力多猛，只需要你用心办好每一个案件，考察关键在平时，不再一时。其实，只要你养成好的习惯，也无需太多额外的付出，只是好好出好自己的庭，有时间多听听别人的庭，既是加分，又获得经验，一举两得。

当然开完庭或听完庭，不要忘了要好好总结一下，以往开完就完了的习惯恐怕是不行了。这实际上是培养一种好的工作和学习习惯。

实际上，这些规则和习惯将塑造一种新的行业生态，在这种新的生态当中，必然会培养出新的物种，那就是自我学习、自我积累、自我管理、自我迭代的公诉新人。

（2）自我管理实现自我迭代

由于相互作用的博弈机制改变了以往的行政命令的司法运行生态，自我驱动的公诉新人将脱颖而出，将实现自我迭代。

一是自我学习

以往的组织学习往往成为公诉人的负担，我还要办案，能不能派别人去，成为经常的托词，即使很好的课程，如果不搞些行政命令也很难保证必要的人数，真实的学习效果就更加堪忧。

这些公诉人到底怎么了，他们就这么厌学么？其实不是，这主要有三个方面的原因：

一是时间碎片化，案件压力本来就大，出庭、提讯都是刚需，更有各种汇报、会议和综合性任务强行冲击，导致办案时间所剩无计，时间高度碎片化，整块的时间非常奢侈的，而培训往往要求整块时间。

二是培训缺乏新引力和针对性，很多实训都是模拟的，真实性不足，很多传授式的培训虽然可能有些大咖，但是不是每个人都需要，缺少针对性、个性化的培训内容和形式。

三是行政命令容易让人产生逆反心里，你这个培训是不错，对我也用，但是领导逼我来的，而且我可能还有点别的事，因此这个时间不凑巧，因此就容易产生逆反心里，学习不够投入，效果就有限。

但是我们的系统是自组织的，每一个观摩庭都是你自己约的，肯定是你自己协调好的时间，因此也是最合适的，既然是你自己选的，当然也是你自己想听，即使最后让你失望，你也没有人可以埋怨，大不了在点评时好好吐槽一番，如果“走心”的话还可以得到不少认同感，从而获得一定的经验值，因此也不亏。

关键是在没有任何强迫，自觉自愿的情况下，学习的心态是最放松的，效果也是最好的。

二是自我积累

几乎没有人爱写简报、经验材料这些官样文章，但是如果真的写出来，很多时候也是让人受益的，至少可以分享了一部分的知识，积累了一部分的经验，但只是由于这种经验积累的模式不是按照写作人的意愿去进行，显得不是十分愉快，自然存在表达不充分的问题。

我们给了他们一个动力，就是以经验值为回报来换取出庭经验，或者说以经验值为诱饵，引诱公诉人积累经验，因此这种积累是自愿的，因为自愿所以就显得不那么辛苦。

而我们又设计了一个二次评价体系，以赞同数来衡量经验的含金量，以提高经验积累的质量，这个过程不是个行政化的考核过程，也是一种同行评价过程，很像给微信公众号的文章点赞，只是我们用的是“赞同”这两个汉字，显得更加严肃一些，从而督促公诉人在经验积累的过程中精益求精。

其实，公诉人也不是发自内心不愿意总结经验，就像我们在搞培训班的时候，很多公诉人也会向我们提建议，能否多分享一下各院的经验，当我问道你写了什么没有时，往往又不说话了，可见对经验是渴望的，只是不愿意付出。

这主要是官方的经验分享主要是还是以单位的形式进行，利益归属主要还是单位，而不是个人，即使个别的文章是以个人名义撰写的，但也没有直接给付的对价或者报酬。

我说的报酬并不一定是金钱，即使是荣誉我们也没有直接可以给付的东西。但是经验值是可以衡量的荣誉对价，它与出庭、观摩所获得经验值是可以合计的，并最终决定个人的排名，它实际上就是一种报酬，是一种“荣誉货币”。

它是抽象的，但又是实在的，可衡量、有价值。这就创造了一种激励机制，使得出庭经验的积累变得“有利可图”，变得划算和实在，这些都使得撰写点评意见和出庭百科显得很带劲，很有实惠。

从此开辟了一种经验积累的新模式，不再是赶鸭子上架，而是鸭子主动要上架，使得学习、积累本身变得很有“价值”，从而促进了自我积累，并最终形成共同积累。

三是自我管理

以往需要加强哪一部分司法工作的时候，我们往往要提加强管理，好像真的是通过管理实现的，但是司法工作的特殊性在于很难真正的管理，因为司法权在下放，司法责任制在落实，每个司法官都是一个独立的个体，如果硬管必然会破坏司法责任制，因此很难真正管起来。

实际上，最好的管理不就是自我管理吗？就向孩子的学业一样，那些自我要求进步的孩子远远好过被家长天天盯着的孩子，由省心，学习还好。

一个组织也一样，出庭能力培养平台就是创造了一个自我管理的环境。

首先，每个人都有自我驱动力，大部分都在为了多获得经验值、提升排名而努力进取，为了进取所以他们将学会自我管理，学会做好出庭准备，安排好观摩的时间，对观摩庭进行仔细的挑选、甚至做好自我的培训计划，在观摩之后认真进行点评、撰写出庭百科，为了竞争每个人都会加强自我的管理，这在以往是难以想象的。

其次，系统内还会设置一些带有管理权限的岗位，促进系统良性运转。一是设置了点评专家的角色。第一批点评专家是从资深公诉人、公诉部门负责人中邀请产生，所谓邀请就是争取他们的同意，这种管理的角色是志愿的，不是行政命令式。

而且有一定的任务，每年至少出一个示范庭，旁听五个观摩庭，其中至少两个是外单位的，扩大交流的范围，引导一般公诉人的点评导向。点评专家也有一些特权，他们的席位不受限制，即使已经预约满了，如果他们想去也要保留一个席位，但是每个庭最多只能有一个点评专家，从而使点评专家扩散开来，以便在更大范围内发挥示范作用，点评专家的点评意见会置顶，以便其他公诉人的进行学习。

但点评专家也要受到规则的约束，如果年内不能完成任务，将自动失去点评专家的资格，空出的点评专家席位将由前一年度排名靠前的出庭检察官依次替补，当然也是自愿的。

从而使脱颖而出的公诉人接续资深公诉人发挥点评引导的功能，使得这一引导功能始终掌握在最有资格、最有意愿的优秀公诉人手中，保持这一功能的稳定性和权威性，同时增加公诉人排名的含金量和荣誉感，让顶尖的公诉人参与到整个出庭工作的管理当中。

（3）行政隐退、人性觉醒

整个系统运行的过程中是几乎没有行政力量介入的，我们只是要求每个员额检察官每年至少出一个观摩庭，即使不能完成，我们也会采取通报等行政命令的方式，只是会扣除3分，留到下一年成为-3分。

意味着这些人在新的一年在起点比别人少3分，要还去年的欠债，而这3分只要多出一个观摩庭就可以弥补，因此也不会给本人造成太大的影响。

这样做的目的就在于放弃以往行政力量的驱动模式，而是选择人性力量的驱动模式，也就是行政隐退、人性觉醒，我们就要引导人们自发的进取，这就是自组织的真谛。人是趋利避害的，人性有自我的取向，这是人类长期进化的结果，已经固化为基因，这种力量其实是最稳定的，要远远大于行政的力量。

我们明白这一点，我们的自组织系统就获得了“核动力”，相比之下那些行政驱动型的组织还是“柴油动力”，驱动效率自然高下立显。

我们就是在创造一个无为而治的系统，只是在创造这个系统的过程中我们并非无所作为，我们做的、是顺应人性精心设计了一套规则，使公诉人像是在过关、打怪一样就实现了出庭能力的整体提高。

这也被称为游戏化思维，但是道理都是相同的，核心就是要顺应人性，而不是悖逆人性。通过设立一整套的经验值回报体系，为工作学习的付出确定了基本的价格体系，通过增加排名的荣誉感、含金量，使付出的获得感不断增强，通过赋予部分积极人员以管理权，增加了公诉人的参与感，反过来又提升了荣誉感，在荣誉感、成就感的趋势下，不但愿意提升自己、将经验分享给他人，而且还能高质量地完成行业引导、经验梳理等繁重的管理任务。

其实，这些付出必然会增加每一个参与者的工作量，只是由于收获感、荣誉感的环绕，形成了心理学家所谓的“心流”（人做一件事情时忘我愉快的状态），这就像旅行、打游戏或刷微信的感觉，虽有疲惫但心情愉悦，因此也感觉不到累。也许这就是人性觉醒的妙处吧。

4.如何通过大数据来汇集出庭经验和分享出庭经验？

出庭能力培养平台在促进能力提升方面主要有两个维度，一方面是直接的出庭或者观摩，即时的得到能力提升；另一方面是系统总结出庭经验，供认反复学习交流。

可以说一个是一次性的学习，另一个是反复性的学习。

从这个意义上来说出庭经验的汇集和分享其实是非常重要的，尤其是对于年轻的公诉人和助理来说，他们出庭经验少，直接的体验少，如果想要弯道超车，加速成长的话，有效的获取间接经验是一条捷径。

但问题是关于出庭的有效经验其实很少。虽然也有一些实务书籍，很多还是理论层面，规范层面来谈，具体的、实战的、最新的经验很少。

这些都有待于公诉人自己来总结。但是很多公诉人由怠于总结，不爱写东西。害怕写的不系统不全面，另外也没有太多的平台和渠道发表。专门汇集出庭经验实时动态更新的平台，几乎是没有。

这就使出庭经验成为一种稀缺资源。

事实上在总结出庭经验时提高最多的是自己，因此先不要提分享，只要总结了自己就有收获。而总结之后，大家相互反复学习，互相补充订正，把就更是提高。

这些出庭经验汇集在一起不就成为我们的出庭百科了么，我们确实也将出庭经验这个板块叫做出庭百科。

目前分为出庭规范、起诉书、公诉意见书、答辩、讯问询问、举证质证、合法性证明、法庭辩论、法庭教育、庭审应变、心理调试等十一个板块。几年来共积累了出庭百科3820条，已经初具规模。

之所以有这样的规模，主要是我们有一套激励机制，首先撰写出庭百科是可以获得经验值，具体来说是根据点赞数获得，也就是不是白写。其次，出庭文字评价也可以在增加标题、分类等方式很容易转化为出庭百科，为出庭百科打开更多的入口，而且更容易与具体案件相互关联。

虽然出庭百科的经验值要比出庭或者观摩获得的要少，但架不住日积月累啊，而且每个人特长不同。有的口语表达能力强，有的文字表达能力强。而且有些单位的案件不够多，仅靠出庭和观摩得分比较有限，这样就可以将出庭百科的经验分享作为一种重要的补充。

不管撰写出庭百科的动机和原因是什么，但只要写了就是其本人的收获，而写得多了，又是整个刑事检察队伍的整体收获。

而且通过这些出庭经验的分享、碰撞，真理才会越辩越明，才能去伪存真。而且通过系统本身的分类机制，出庭经验的累积更加系统，很多出庭人员可以缺啥补啥，想要了解哪方面的出庭经验就可以比较方面的找到。

通过这些系统性的经验分享，再结合感性的观摩，以及自己出观摩庭的亲身实践，出庭能力都得到了一个立体性的滋养和提升，为出庭能力的加速提高奠定了一定的基础。

随着出庭百科汇集的越来越多，对出庭百科的整理也成为一个大问题。这些出庭百科不是放在这里就行了，虽然有分类，但也有分类错误的情况发生吧，这就需要重新归类，也有的经验随着新的文件出台也就过失了，这就需要即使淘汰吧，这就需要专门人员进行筛选，这可是系统自己做不到的。还有有些出庭经验也存在以偏概全的问题，也有必要进行补充完善，等等。

出庭百科作为一个经验数据库还必须设置一些管理人员，但是为了降低行政成本，我们的出庭能力培养平台是不设专门管理员的。

这样我们就借鉴点评专家的经验，又设置了出庭百科编辑的角色，也把这个整理出庭经验的工作，打造为一种荣誉岗位。邀请出庭经验值排名靠前的检察官或检察官助理中担任。

每名百科编辑都对出庭百科享有完整的编辑权，都可以对出庭百科进行全面的编辑，可以修改、删除或者重新分类，从而保证出庭百科始终保持最高的水准。

百科编辑也是一项荣誉，并还要接受其他公诉人的评价，根据多轮评价累积的分值形成年度出庭编辑的荣誉。

而百科编辑一旦在出庭经验值跌出前二十名的排名，也将会失去出庭编辑，从而保证出庭百科始终是由最优秀的人员负责运营。两个角色的进入就使得出庭能力培养平台形成了一套自我运行的机制，无需太多的外部介入就可以解决大部分的问题。

这样就在已经激励起来发表很多出庭百科的初步繁荣的基础上，由加入了百科编辑的精心整理，这就使得出庭经验更加系统也更加具有权威性，从而也吸引愿意在这里发表出庭经验，形成一种出庭经验汇集分享的良性循环。

而出庭视频是最近增加的板块，这一板块主要是上传出庭录像，当然也要注明出庭录像的看点。出庭视频的设立就弥补疫情防控常态下，去现场旁听比较难，主要以来线上旁听，而线上旁听缺少回看机会的问题。从而将好的出庭录像上传到内网供大家反复观看，这就在主要以文字为载体的出庭经验数据库基础之上，又增加影像数据库，目前已经积累了上百部出庭录像可以在内网上反复观看，从而可以更加立体、直观的，又能够循环反复的进行出庭经验学习。

第九章：出庭大数据——公诉人进化论（刘哲演讲视频）