"Big Data" vormt een grote uitdaging voor advocatenkantoren en in-house teams belast met de voorbereiding en het beantwoorden van juridische kwesties. Saida Joseph, Internationaal Directeur van Document Review Services, Epiq Systems en Celeste Kemper, Directeur van Document Review Services Asia, Epiq Systems, leggen uit hoe de nieuwste technology assisted review (ook gekend als "voorspellende codering") een kritisch voordeel biedt bij de zoektocht naar en analyse van grote gegevensvolumes.
De mogelijkheden voor
documentbeheer zijn de laatste tien jaar ernstig gewijzigd. We leven niet
langer in een wereld waarin het universum van bewijsmateriaal bestaat uit
kasten en afgedrukte documenten en de omvang van een zaak bepaald wordt door
het aantal archiefdozen. We leven in een "Big data" tijdperk, een
periode die bepaald en gecontroleerd wordt door de uitwisseling van enorme
hoeveelheden elektronische informatie.
Onze email accounts,
smartphones, tablets, sociale platformen en zoekmachines barsten van gegevens;
het overschrijdt grenzen, neemt nieuwe vormen aan en wordt opgeslagen op
virtuele servers. Jaarlijks kan een
typisch Fortune 500 bedrijf meerdere petabytes aan elektronische informatie
produceren. Dagelijks worden er per werknemer vermoedelijk ongeveer 100 emails
verstuurd en ontvangen.[1] Elk stukje
gegeven passeert waarschijnlijk het bureaublad van massa's, misschien wel
honderden individuelen. Of ze nu
opgeslagen worden op de harde schijven, databanken, verwisselbare media zoals
USB-sticks en cd's, of op back-up tapes, de gegevens worden gearchiveerd en
gerepliceerd en groeien exponentieel.
Volgens een onderzoek uit 2009,[2] zullen de naar
schatting 800 exabytes – dat zijn 800 miljard gigabytes – aan informatie die in
2009 ontwikkeld werden, in 2020 hebben toegenomen tot 35 triljoen gigabytes. Dat is bijna 44 keer meer dan de 24 DVD's met
informatie die in 2009 naar schatting gemaakt zijn per man, vrouw en kind op de
planeet.
In dit digitale tijdperk zijn
nieuwe technologieën voor het zoeken naar en het analyseren van grote
hoeveelheden elektronisch opgeslagen informatie (ESI) noodzakelijk om
juridische vragen voor te bereiden en erop te reageren. Technology assisted review (TAR) is de
nieuwste revolutie in ESI-technologie die het volume gegevens en de inhoud van
intelligente analyse helpt te minimaliseren.
Technology Assisted Review 101
TAR verwijst naar een soort
van machine learning technologie die gebruik maakt van de input van een
reviewer en analyses om responsieve of belangrijke documenten te helpen
identificeren. Sommige TAR-technologieën
verzamelen gewoonweg informatie in responsieve of niet-responsieve groepen
terwijl anderen relevante classificaties geven aan de documenten. Door gebruik te maken van deze technologie,
bekijkt een vakdeskundige een verzameling aan documenten (soms geselecteerd
door een raadgever of willekeurig geselecteerd door software) en codeert de
documenten als relevant of niet relevant.
De software past een principe toe dat bekend staat als "statistisch
leren" om complexe patronen in de gegevens te herkennen en leert actief
van de beslissingen of codes van de beoordelaar. Van zodra de software is ingeleerd, kan het
de waarschijnlijke responsiviteit van de documentverzameling voorspellen.
Aanpassing
TAR wint momenteel aan
gerechtelijke aanvaarding als een redelijke en evenredige aanpak voor ESI
beoordeling. Amerikaans
Onderzoeksrechter, Andrew Peck, heeft de eerste goedkeuring voor het gebruik
van de TAR uitgegeven in het geval van de rechtszaak Da Silva Moore v. Publicis Groupe.[3] In deze belangrijke
rechtszaak zei Rechter Peck, "Computer-assisted review is een beschikbaar
middel dat serieus zou moeten worden overwogen bij zaken met een groot volume
aan gegevens".[4] Andere
rechters hebben het voorbeeld van rechter Peck gevolgd. Bij een beslissing van juli 2012 wees rechter
Schiendlin op de beperkingen van het zoeken op sleutelwoorden bij een grote
Freedom of Information Act (FOIA) door volgende op te merken: "Partijen kunnen
(en zouden vaker moeten) vertrouwen op potentiële semantische indexering,
statistische waarschijnlijkheid modellen en technologieën van machinaal leren
om responsieve documenten te vinden... Deze methodes kunnen de effectiviteit en
de efficiëntie van zoekopdrachten aanzienlijk verhogen."[5] Tijdens een meer recente uitspraak heeft
rechter Lewis A. Kaplan uit het Zuidelijke district van New York, gedeeltelijk
vertrouwd op TAR bij de afwijzing van een lastig bezwaar tegen een dagvaarding.[6]
Voorspellende codering wordt
ook gebruikt bij regelgeving kwesties en speelt een belangrijke rol in de
recente fusie tussen Annheuser-Busch InBev en Grupo modelo. Het Amerikaans
Departement van Justitie heeft het gebruik van voorspellende codering bij dit
proces goedgekeurd, "Als het goed functioneert, verlaagt voorspellende
codering (TAR) de last van document review en -productie en tegelijk zorgt het
voor een onderscheid in de documenten die nodig is om eerlijk en volledig
transacties te analyseren en uit te voeren." [7]
Voordelen van TAR
TAR biedt diverse voordelen
tegenover de traditionele aanpak voor document review. Het geeft statistieken
over een document die een hitlijst van trefwoorden niet voorziet. Dit kan erg
waardevol zijn voor een eerste inschatting over een zaak, om een strategie te
ontwikkelen in een zaak en voor een efficiëntere en kostenefficiënte review
workflow. TAR neemt ook de menselijke vooringenomenheid bij het zoeken op
trefwoorden als eerste veronderstellingen omtrent de feiten weg en bovendien verandert
bewijs vaak gedurende het onthullingsproces.
TAR technologie leert op basis van training van een belanghebbende met
kennis van de kwesties in de zaak maar in tegenstelling tot mensen, wordt een
computer niet ziek en informeert het de beoordelaar wanneer een gecodeerde
beslissing varieert van de voorspelde relevante scores. Zoeken op kernwoorden kan gebruikt worden in
combinatie met voorspellende codering om de resultaten te valideren en
discrepanties tussen de relevante scores en de zoektermresultaten te evalueren.
TAR software neemt ook een syntactische aanpak aan en kan daarom gebruikt
worden om meertalige documentverzamelingen consistent te beoordelen.
Mens vs. machine
Een van de grootste mythen
over TAR is dat de technologie een bedreiging vormt voor de rechtspraktijk
omdat machines advocaten vervangen. In
werkelijkheid zorgt TAR voor een verhoogde intelligentie bij het juridisch
proces waarbij mens en machine samenwerken.
Met een exponentiële groei aan gegevensvolumes is de menselijke lineaire
beoordeling van documenten moeilijk bij rechtszaken zonder extreme kosten,
onnodige belasting en een groot tijdskader.
Maar machines alleen zijn niet het antwoord. Het gebruik en de waarde van de output is
enkel betrouwbaar dankzij de intelligente input en training van een menselijk
expert. TAR is geen vervanging voor menselijke beoordeling - het kan een
hulpmiddel zijn bij het organiseren en identificeren van kwesties voor het
juridisch team zodat zij het risico of de waarde van een document voor een strategie
kunnen evalueren, de toepassing kunnen bepalen en de ontwikkeling van feiten
efficiënter kunnen uitvoeren.
Overleven van de sterkste
Inzicht in de technologische
tools beschikbaar voor het analyseren en beoordelen van grote hoeveelheden data
is essentieel om te overleven in het Big Data tijdperk. De enorme hoeveelheid
gegevens en het scala aan mogelijkheden waarop de gegevens tegenwoordig kunnen
worden overgedragen en ontvangen, voegt een complexe waarde toe aan het
beoordelingsproces en vormt een uitdaging voor de traditionele methode. TAR mag
dan niet bij elke zaak de geschikte tool zijn, weten hoe en wanneer TAR te
gebruiken, kan een competitief voordeel bieden in dit digitale tijdperk.
[1] Email statistieken verslag, 2013-2017. The Radicati Group, Inc.
[2] Gantz, John en
David Reinsel "The Digital Universe Decade – Are You Ready?” IDC iView. Mei 2010
[3] Da Silva Moore
v. Publicis Groupe, 287 F.R.D. 102 (S.D.N.Y. 2012)
[4] Id. at 15.
[5] Nat’l Day Laborer Org. Network v. United States
Immigration & Customs Enforcement Agency, 877 F. Supp.
2d 87, 112 (S.D.N.Y. 2012)
[6] Chevron Corp. v. Donziger, No. 11 Civ. 0691, 2013 U.S. Dist. LEXIS 36353
(S.D.N.Y. 15 maart 2013).
[7] http://www.justice.gov/atr/public/speeches/292573.pdf
Geplaatst op 23-06-2014, door Dhr R Perey, Lindsell marketing