Investigació innovadora sobre això és el que va dir

La sorprenent efectivitat i longevitat de l’ara llegendari això és el que ella va dir broma, popularitzada recentment de nou amb l'ajuda de L'Oficina , ha fet més que proporcionar a milions una resposta de genoll a la conversa casual. Ara ha assolit un nou nivell de significació social, inspirant una investigació lingüística seriosa. Es presenta en forma de treball de recerca anomenat Això és el que va dir: identificació doble , amb l'autor de dos estudiants d'informàtica, Chloe Kiddon i Yuriy Brun .

En el seu treball, la parella descriu la seva creació del Doble concursant mitjançant Noun Transfer o DEviaNT un enfocament que identifica automàticament això és el que va dir bromes (TWSS). Anomenen l'anàlisi metafòrica del seu enfocament, que té un doble significat, i es basa en ponderar certes paraules com a més atractives que altres. L’equip va ponderar diversos noms i verbs atractius i després va executar el seu algorisme.

En la seva investigació, la parella també va descobrir algunes regles interessants per a les bromes de TWSS. Per exemple, el risc d'invocar una broma de TWSS incorrectament. Del seu estudi:

Per exemple, en un entorn social, el cost de dir això és el que va dir inadequadament és elevat, mentre que el cost de no dir-ho quan podria haver estat adequat és insignificant.

Per abordar-ho i obtenir millors resultats, l'equip va utilitzar un algorisme d'aprenentatge. Entre altres coses, això va establir la creació de falsos positius 100 vegades superior als falsos negatius.

Després d’executar DEviaNT a través d’una sèrie de material de broma TWSS pre-identificat i cita aleatòria. En la prova, van utilitzar 1,5 frases eròtiques i 57.000 frases no eròtiques. L’equip afirma que va assolir una taxa d’èxit superior al 71,4%. Tot i que això pot no semblar massa, l’equip diu que amb un conjunt de dades més gran, esperarien uns resultats més propers al 99,5%. A més, DEviaNT va donar alguns resultats interessants. De nou, des de l’estudi:

DEviaNT va retornar 28 sentències d’aquest tipus (totes empatades per al més probable que siguin TWSS), 20 de les quals són veritables positius. Tot i això, 2 dels vuit falsos positius són de fet TWSS (tot i provenir de les dades de proves negatives): Sí, doneu-me tota la crema i ja no hi és. i sí, però el seu forat de vegades fa olor.

Alguns poden desvirtuar aquesta investigació, anomenant-la simplement una alosa i poc valor. Es tractaria d’un atac de cop baix, ja que fins i tot els investigadors descriuen el seu treball com un problema de comprensió del llenguatge natural dur. (Això és el que ella va dir.)

( Nou científic via L’escapista )