online liggende 6 29

Der er tre ting, du kan være sikker på i livet: død, skat - og løgn. Sidstnævnte ser bestemt ud til at være blevet understøttet af Storbritanniens nylige Brexit-folkeafstemning med en nummer af Forlad kampagnens løfter ser mere ud ligesom porkie tærter end solide sandheder.

Men fra internetannoncering, visumansøgninger og akademiske artikler til politiske blogs, forsikringskrav og datingprofiler er der utallige steder, vi kan fortælle digitale løgne. Så hvordan kan man gå rundt med at spotte disse online fibs? Nå, Stephan Ludwig fra University of Westminster, Ko de Ruyter fra City University Londons Cass Business School, Mike Friedman fra det katolske universitet i Louvain, og jeres virkelig har udviklet en digital løgnedetektor - og den kan afdække en lang række internet-sandheder .

I vores nye forskning, vi brugte sproglige signaler til at sammenligne titusinder af e-mails, der var præidentificeret som løgne, med dem, der vides at være sandfærdige. Og ud fra denne sammenligning udviklede vi en tekstanalytisk algoritme, der kan opdage bedrag. Det fungerer på tre niveauer.

1. Ordbrug

Søgeordssøgninger kan være en rimelig tilgang, når der behandles store mængder digitale data. Så først afdækkede vi forskelle i ordbrug mellem de to dokumentsæt. Disse forskelle identificerer tekst, der sandsynligvis indeholder en løgn. Vi fandt ud af, at enkeltpersoner, der lyver, generelt bruger færre personlige pronomen, såsom jeg, dig og han / hun og flere adjektiver, såsom strålende, frygtløs og sublim. De bruger også færre førstepersons entalspronomen, som jeg, mig, min, med uoverensstemmelsesord, som kunne, burde, ville, samt flere andenpersons pronomen (dig, din) med præstationsord (tjen, helt , vinde).

Færre personlige pronomen indikerer en forfatters forsøg på at distancere sig fra deres ord, mens brug af flere adjektiver er et forsøg på at distrahere fra løgnen gennem en overflod af overflødige beskrivelser. Færre førstepersons entalpronomier kombineret med uoverensstemmelsesord indikerer mangel på subtilitet og et positivt selvbillede, mens flere andenpersons pronomen kombineret med præstationsord indikerer et forsøg på at smigre modtagere. Vi inkluderede derfor disse kombinationer af søgeudtryk i vores algoritme.


indre selv abonnere grafik


2. Strukturkontrol

En anden del af løsningen lå i at analysere variansen af ​​kognitive procesord, såsom årsag, fordi, kender og burde - og vi identificerede et forhold mellem strukturord og løgne.

Løgnere kan ikke generere vildledende e-mails fra den faktiske hukommelse, så de undgår spontanitet for at undgå afsløring. Det betyder ikke, at løgnere generelt bruger mere kognitive procesord end folk, der fortæller sandheden, men de inkluderer disse ord mere konsekvent. For eksempel har de en tendens til at forbinde hver sætning til den næste - "vi ved, at dette skete på grund af dette, fordi dette burde være tilfældet". Vores algoritme registrerer sådan brug af procesord i kommunikation.

3. Kryds-e-mail-tilgang

Vi studerede også måder, hvorpå en afsender af en e-mail ændrer deres sproglige stil, mens vi udveksler et antal e-mails med en anden. Denne del af undersøgelsen afslørede, at efterhånden som udvekslingen fortsatte, desto mere havde afsenderen tendens til at bruge de funktionsord, som modtageren brugte.

Funktionsord er ord, der bidrager til syntaksen eller strukturen, snarere betydningen af ​​en sætning - for eksempel en, er, til. Og afsendere reviderede den sproglige stil af deres meddelelser for at matche modtagernes. Som en konsekvens identificerer og indsamler vores algoritme sådan matchning.

Spændende applikationer

Forbrugerhunde kan bruge denne teknologi til at tildele en "muligvis løgn" score til reklamer af tvivlsom karakter. Sikkerhedsfirmaer og nationale grænsestyrker kan bruge algoritmen til at vurdere dokumenter, såsom visumansøgninger og landingskort, for bedre at overvåge overholdelse af regler og regler for adgang og indrejse. Sekretærer for eksamensudvalg for videregående uddannelser og redaktører af akademiske tidsskrifter kan forbedre deres korrekturværktøjer til automatisk at kontrollere studerendes speciale og akademiske artikler for plagiering.

Faktisk fortsætter de potentielle applikationer og fortsætter. Politiske blogs kan med succes overvåge deres interaktion med sociale medier med henblik på tekstuelle anomalier, mens dating- og gennemgangssider kan klassificere meddelelser, der sendes af brugerne på baggrund af deres "muligvis løgnende" score. Forsikringsselskaber kan gøre bedre brug af deres tid og ressourcer til rådighed til revisionspåstand. Revisorer, skatterådgivere og retsmedicinske specialister kan undersøge årsregnskaber og skattekrav og finde vildledende rygepistoler gennem vores algoritme.

Mennesker er overraskende dårlige til bevidst at opdage bedrag. Ja, menneskelig nøjagtighed, når det kommer til at spotte en løgn, er kun 54%, næppe bedre end tilfældigheder. Vores digitale løgnedetektor er i mellemtiden 70% nøjagtig. Det kan sættes i gang for at bekæmpe svig, uanset hvor det forekommer i edb-indhold, og efterhånden som teknologien udvikler sig, kan dens Pinocchio-advarsler automatiseres fuldstændigt, og dens nøjagtighed øges yderligere. Ligesom Pinocchios næse reflekterede falskhed, gør også vores digitale løgnedetektor det. Fibber pas på.

Om forfatteren

The ConversationTom van Laer, lektor i marketing, City University London

Denne artikel blev oprindeligt offentliggjort den The Conversation. Læs oprindelige artikel.

Relaterede bøger

at InnerSelf Market og Amazon