„The Bing Sting“ este numele de cod sub care, la sfârşitul anului trecut, inginerii Google au încercat să demonstreze că Bing, motorul de căutare dezvoltat de Microsoft, „se inspiră“ din rezultatele motorului care a stat la baza corporaţiei Google. Concluziile, negate imediat de Microsoft, au fost că Bing operează la fel ca un student nepregătit, care la examen se uită peste umăr în lucrarea colegului de bancă.
Scandalul îşi are originea într-un termen prost căutat: „tarsorrhaphy“, despre care Wikipedia spune că este o procedură chirurgicală prin care pleoapele sunt parţial cusute pentru a le micşora deschiderea, în cazuri foarte grave de keratoconjunctivită. Cel care a căutat termenul a transmis spre căutare „torsoraphy“, căutare care l-a îndrumat spre „tarsorrhaphy“, subliniindu-se faptul că termenul a fost corectat şi că rezultatele sunt pentru termenul corect.
Spre surprinderea internautului, motorul de căutare Bing l-a îndrumat spre aceeaşi secţiune din Wikipedia, însă fără a anunţa că termenul fusese corectat.
De aici a pornit cercetarea. Timp de câteva luni, inginerii Google au început să supravegheze şi să compare rezultatele Bing. Conform blogului oficial (googleblog. blogspot.com), a devenit la un moment dat evident că URL-uri proaspăt indexate de Google sau care-şi modificaseră poziţia în ordinea rezultatelor începeau să apară şi la Bing. Rezultatele începeau să semene şi la căutări cu grad ridicat de popularitate, şi la cele mai rare, după care au început să semene şi la cele foarte rare şi chiar la cele pe care inginerii Google le considerau „erori de algoritm“. Pentru a demonstra că Bing „fură“, era însă nevoie de dovezi mai consistente.
Astfel, Google a „inventat“ în jur de 100 de „căutări sintetice“ (synthetic queries) - termeni pe care nu i-ar căuta nimeni, decât din greşeală, şi chiar şi atunci ar fi improbabil. Apoi, cu ajutorul unui program, a direcţionat rezultatele spre un site specific, care nu avea nimic de-a face cu căutarea în sine. De exemplu, dacă cineva caută „hiybbprqag“, va fi direcţionat spre site-ul teamonetickets.com. Care, evident, nu conţine nici acest termen, nici vreo referire la el, deci nu există niciun motiv posibil pentru care o căutare obişnuită să returneze acel rezultat. Apoi, 20 de ingineri au primit laptop-uri cu versiuni de Windows proaspăt instalate, au fost trimişi acasă şi li s-a indicat să caute termenul în cauză folosind Internet Explorer 8, cu bara de utilităţi Bing activată, cu opţiunile standard din instalare neafectate. Căutarea a fost făcută folosind motorul de căutare www.google.com, iar inginerii au accesat primul link sugerat, teamonetickets.com. Aceasta era „găleata cu miere“. Şi, nicio surpriză!, muştele s-au prins în capcană: la două săptămâni după ce a început experimentul, cine căuta „hiybbprqag“ pe Bing era direcţionat, ca prim rezultat, către - evident! - teamonetickets.com.
Mergând mai adânc, spre zona unde un algoritm propriu al Microsoft ar fi putut interveni pentru a depista eventuale potriviri, au fost depistate aceleaşi probleme. De exemplu, „delhipublicshcool40 chdjob“ ar fi putut însemna rezultate sugerate din zona şcolilor publice din Delhi, a ofertelor de joburi din zonă sau măcar ceva asemănător. Pentru termenul de mai sus, Google a „învăţat“ motorul de căutare să sugereze pe primul loc site-ul Clyde-Finlay Area Credit Union. Bing a returnat rapid acelaşi rezultat.
Mecanisme de furt şi de apărare
Specialiştii Google au ajuns la concluzia că Microsoft utilizează o combinaţie între „Suggested sites“ din Internet Explorer 8 şi „Cus-tomer Experience Improvement Program“, serviciu conţinut de bara de instrumente Bing. Nu este exclus, de ase-menea, să existe şi alte metode prin care Microsoft află ce caută oamenii prin Google şi pe ce link-uri apasă.
La începutul lui februarie, Microsoft a replicat, anunţând că „nu copiază rezultatele Google“. Mai exact, directorul Bing, Stefan Weltz, a declarat că „(la Microsoft) folosim semnale şi abordări multiple în afişarea rezultatelor. Scopul nostru suprem este acela de a determina intenţia fiecărei căutări, astfel încât să oferim cele mai relevante răspunsuri. Programe opţionale, precum bara de instrumente, ne ajută cu fluxul de click-uri, însă acesta este doar unul dintre multele semnale pe care le folosim atât noi, cât şi alte motoare de căutare, pentru a ierarhiza site-urile“. Destul de clar, nu?
Ceva mai explicit este un analist din Silicon Valley, Matt Rosoff, care aminteşte despre declaraţii şi rapoarte publicate de Microsoft în ultimii ani, unele mai explicite decât altele. În primul rând, Bing Toolbar este re-brandingul fostului Microsoft Live Toolbar. Opţiunile sunt însă aceleaşi, iar utilizatorii sunt „întrebaţi“ de la în-ceput (de aceea e bine să citiţi capitolul ilizibil de „Termeni şi Condiţii“) dacă sunt de acord ca această bară să colecteze informaţii despre obiceiurile de căutare ale utilizatorilor. Căsuţa în cauză este bifată automat la instalare şi trebuie dezactivată dacă nu sunteţi de acord ca Microsoft să afle totul despre click-urile dumneavoastră.
Dacă este un comportament etic sau nu, asta rămâne de discutat şi de disputat între Google, Microsoft şi alţii. Pe utilizatori îi interesează rezultatele.
Concluzia SFin: inginerii din ambele părţi mai au mult de lucru
Am făcut şi noi propriul experiment. Pentru că discuţiile cu IE8 şi Bing Toolbar şi-au găsit deja concluziile, am accesat de pe Mozilla Firefox (v 3.6.13) atât Google.com, cât şi Bing.com, căutând „Angry Birds free online“, un „string“ capabil să „dezvăluie intenţiile“ necesare ambelor motoare. Este, de asemenea, de notorietate faptul că jocul care a isterizat utilizatorii de iPhone nu este disponibil online cu titlu gratuit. Primele 10 rezultate sunt discutabile, dar relevante.
Google.com a returnat cinci rezultate care duceau spre site-uri de jocuri online care doar conţineau cuvintele-cheie, însă nu aveau disponibil jocul şi nici nu deţineau vreo informaţie despre acesta. Dintre acestea, pe poziţiile trei şi patru din zece era plasat acelaşi site, play181.com. Un alt site asemănător, al şaselea rezultat, nu era funcţional. Primul dintre cele 10 rezultate era totuşi un site de unde se putea descărca jocul, contra cost, direct pe telefon. Celelalte trei rezultate au fost: Wikipedia (poziţia 9 din 10) şi, în sfârşit, answers.com (poziţia 5) şi chacha.com (poziţia 7), ambele oferind preţioasa informaţie că jocul nu poate fi jucat gratuit online. Bilă neagră pentru Google: Rovio, compania care a creat jocul, nu s-a aflat în topul rezultatelor. S-a aflat, în schimb, pe prima pagină de rezultate oferite de Bing, pe poziţia a şaptea, în timp ce răspunsul necesar (nu e disponibil) a venit tot din partea chacha.com, rezultat aflat pe poziţia a opta. Restul de opt rezultate au fost site-uri care promiteau şi nu ofereau nimic. Play181.com a apărut tot de două ori în primele zece rezultate, pe poziţiile 1 şi 5. În concluzie: ingine-rii din ambele părţi mai au mult de lucru...