Nastanak portala novenews.net

Nastanak portala novenews.net
180
1
1

Internetski pretraživači ili tražilice su posebne Web stranice koje imaju funkciju pomoći u pronalaženju informacija koje se nalaze na nekim drugim Web mjestima. Informacije mogu biti Web stranice, slike, filmovi, datoteke, baza podataka, društvene mreže, otvoreni imenici i slično. Web imenike održavaju ljudi kao uređivači teksta, do internetski pretraživači djeluju po nekom matematičkom algoritmu koji može biti kombiniran sa ljudskim intervencijama.

Prvi alat upotrijebljen za pretraživanje na Internetu kreiran 1990. zvao se Archie. Pretraživao je imena datoteka i naslove, ali nije indeksirao sadržaj tih datoteka. Prvi internetski pretraživač koji je indeksirao sadržaj napravljen je 1993. i zvao se Wandex. Jedan od prvih internetskih pretraživača čitavog teksta napravljen je 1994. i zvao se WebCrawlwr, koji je dopuštao korisnicima pretraživanje bilo koje riječi s bilo koje stranice. Ubrzo su se pojavili mnogi pretraživači kao Excite, Infoseek, Inktomi, Light, AltaVista, Yahoo, MSN Search, te Google.

Google se oko 2000. probio na prvo mjesto po korištenju, a može pretraživati po ključnim riječima koje su povezane sa operatorim, I (AND) a mogu se povezati i sa operatorom ILI (OR), a i drugim manje korištenim. Google je razvio alat PageRank koji raspoređuje Web stranice temeljem broja i PageRankova ostalih Web mjesta i stranica koje se na njih spajaju, s pretpostavkom da se na češće korištene stranice spajaju također bolje stranice. Osim toga, što je neka stranica više posjećena to se ona nalazila više pri vrhu kada korisnik želi naći pojam koji se nalazi na toj stranici.

Internetski pretraživači skupljaju različite podatke o internetskim stranicama, uključuju ih u svoju bazu, te nude svakom korisniku koji traži određeni pojam, uslugu, proizvod, ili nešto drugo. Internetski pretraživač se sastoji od programa za prikupljanje podataka sa drugih Web stranica, index koji sadrži pojmove koje je program za sakupljanje sakupio tijekom pretrage neke Web stranice, te pretraživač indeksa.

Korisnost pretraživača ovisi o relevantnosti rezultata koje on daje. Iako mogu postojati milijuni Web stranica koje uključuju određenu riječ ili izraz, neke stranice mogu biti relevantnije, popularnije, ili pouzdanije od drugih. Većina pretraživača primjenjuje metode nizanja rezultata sa ciljem pribavljanja „najboljih“ rezultata, pri čemu se razlikuju pojedini pretraživači.

Pretraživač Wolfram Alpha je znanstveni pretraživač koji podatke indeksira prema puno različitih kriterija, ali se ti kriteriji ne mogu međusobno kombinirati.

 

Meta-pretraživači su internetski pretraživači koji istovremeno koriste više drugih pretraživača odjednom, te prikazuju rezultate svakog od njih.

Pojedine Web stranice koje služe za plasiranje određenih masovnih sadržaja spremljenim u svojim bazama podataka na sličan način pretražuju svoje baze podataka. Najpoznatija takva web adresa je Youtube koja prikuplja filmove od korisnika, te omogućuje pretragu i po drugim kriterijima, a ne samo po ključnim riječima.

Pošto se pretraga u svim navedenim tražilicama vrši najčešće preko ključnih riječi, a rjeđe prema temama, to su sve lingvistički pretraživači. Problem kod ovih lingvističkih pretraživača koji se temelje na ključnim riječima što oni pretražuju sadržaje po jednom jeziku. Osim traženja po ključnim riječima (tagovima) algoritmi mjere intenzitet i prioritet stranica na kojima pronalaze ključne riječi. Tu su moguće manipulacije rezultatima koje mogu biti algoritamski ugrađene, ili organizirane od strane konkurencije koja želi sakriti određene sadržaje tržišnih protivnika.

Algoritamski se može nekim sadržajima i stranicama dati veći prioritet tako da se te stranice nalaze pri vrhu rezultata pretrage. Veći prioritet se obično daje onima koji plaćaju reklamu i onima stranicama koje se češće otvaraju, osobito u bliskoj prošlosti.

 

Tržišni konkurenti, kada žele sakriti neke tuđe stranice to mogu učiniti tako da svakodnevno na internetske portale plasiraju desetke sadržaja koje u naslovu, na početku teksta i u tagovima imaju iste ključne riječi kao i sadržaj koji žele sakriti. Zahvaljujući tome korisnik koji želi naći takvu stranicu koju je prije godinu ili više dana vidio to ne može učiniti osim ako je spremio link na stranicu, ili ako zna točan naziv te stranice. Na ovaj način ostvaruje se svojevrsna cenzura sadržaja koje netko želi sakriti.

 

Osnovna slabost svih današnjih pretraživača je to što oni riječi vide kao niz slova, a ne prepoznaju značenja pojedinih riječi. Pošto umjetna inteligencija ne poznaje značenja riječi ona ne može znati ni značenja fraza, ili rečenica. Ako u neki prevodilački program upišemo odlomak nekog teksta prevodilac će ga dosta dobro prevesti na drugi jezik. Međutim, ako taj prijevod ponovno prevedemo na početni jezik dobit ćemo manje smislen tekst. Ako to ponovimo 6-7 puta dobit ćemo tekst koji nema nikakvo značenje.

 

Značenja riječi mogu biti osjetilna, emocionalna i apstraktna. Najvažnija osjetilna značenja su vidna značenja, slušna značenja, mirisna značenja, okusna značenja, opipna značenja. Emocionalnih značenja ima puno više a oni opisuju emocije koje pojedina riječ opisuje, ili izaziva kod čitatelja, ili slušatelja.

 

Vidna značenja pojedinih riječi se mogu definirati slikama, ili kratkim filmovima pokreta. Slušna značenja pojedinih riječi se mogu definirati kao kao izgovor riječi. Kada se riječ čita onda ta riječ može asocirati na druga slušna, vidna i druga značenja, a kada riječ čujemo iz nje možemo doznati i informacije o tome da li ju je izgovorio neko poznat ili nepoznat, odrastao čovjek, žena dijete i slično. Na isti način i iz drugih vrsta značenja riječi moguće je izvući više različitih informacija.

Značenja pojedinih riječi se razlikuju po prioritetu, intenzitetu i vremenskom redoslijedu. Od više različitih značenja riječi u rečenici neko značenje je važnije od drugog. U nekoj drugoj rečenici neko peto značenje može imati najviši prioritet, što ovisi o kontekstu riječi u rečenici, ili nekom odlomku teksta.

 

Po intenzitetu značenja riječi može se mijenjati važnost neke riječi u rečenici, ili rečenice u širem tekstu, iz čega se mogu dobiti i informacije o važnosti riječu u konkretnom kontekstu. Riječi u nizu mogu označavati i različiti vremenski tijek događanja, kojim se slika, zvuk, ili drugo značenje mijenja kroz vrijeme.

 

Da bi umjetna inteligencija mogla ispravno prevoditi baze podataka koje služe za prevođenje morala bi osim samih riječi na različitim jezicima za svaki jezik imati tabelarni prikaz svih mogućih značenja za svaku pojedinu riječ. Uz svako samostalno slovo, riječ, frazu ili izraz morala bi biti slika te riječi ili izraza u nekoliko varijanti, kratki film, zvuk, oznaka mirisa, okusa opipa i svih ostalih značenja koja slovo, riječ, fraza ili izraz može imati. Tek tada bi umjetna inteligencija mogla niz riječi prevoditi u neki "smisleni prostorno vremenski četverodimenzionalni film" koji bi ponovno prevodila u riječi i rečenice drugog jezika.

 

Kako bih prevladao nedostatke traženja sadržaja koje se temelje na ključnim riječima čije značenje umjetna inteligencija ne razumije osmislio sam platformu na koju bi korisnici mogli stavljati svoje tekstove, ili pretraživati tuđe tekstove po određenim najvažnijim značenjima, bez obzira na kojem su jeziku napisane. Pretragom po ključnim riječima često se pojavi tisuće rješenja, a kako bi se rezultati bolje filtrirali zamislio sam kako bi autori sadržaja, koji žele lakše doprijeti do ciljanih čitatelja mogli svoje tekstove prije stavljanja na internet označiti sa više različitih značenja (kriterija - oznaka) koji se mogu međusobno kombinirati. Međusobno su povezani operatorom AND te se odabirom sve većeg broja kriterija broj rezultata filtriranja smanjuje, a preciznost pretrage povećava.

 

U prvom pokušaju početkom 2009. godine napravio sam web stranicu gdje sam potencijalnim autorima omogućio da svoje stranice označe prema šezdesetak kriterija podijeljenih u 4 padajuća izbornika (tema, stil, za koga, vrsta stranice), sa time da korisnih iz svakog padajućeg izbornika može odabrati po jedan kriterij, aodabrani kriteriji su povezani operatorom AND ( i ). Stranica je zamišljena kao svojevrsni web imenik. Korisnici bi filterom tražili tekstove u kojima autori tekstova navode linkove koji detaljnije opisuju ono što korisnik logičkim pretraživanjem po upisanim značenjima traži. Ovaj pokušaj nije uspio pošto je stranica bila zamišljena samo za pretraživanje unesenih zapisa i upućivanje na druge stranice, a ne kao društvena mreža, pa zainteresiranih korisnika nije bilo.

Početkom 2018. odlučio sam ponovno pokušati i angažirati programere koji bi napravili web platformu po mojim uputama. Ovaj novi pokušaj zamišljen je kao društvena mreža na koju svaki registrirani korisnik može stavljati svoje tekstove kao medij za vlastitu promociju, promociju svojih ideja, ili komentirati tuđe sadržaje. Svaki posjetitelj stranice može pratiti druge autore, može druge dodati na svoj popis korisnika čije tekstove prati, ili može pretraživati tekstove po 134 kriterija. Odabrani kriteriji se mogu kombinirati istovremenim izborom više kriterija za pretragu. Sa ovakvim načinom pretrage preciznost pretraga može se povećati milijun puta, te pretraga donosi rezultate koji su namijenjeni baš onom tko traži nekakvu informaciju. Koliko će pretraga biti precizna ovisi o tome koliko je autor teksta precizno označio svoj tekst, te o onom tko upisom kriterija za pretragu traži ono što ga zanima.

 

Stranica je registrirana pod imenom domene novenews.net a zamišljena je kao kombinacija news portala, bloga, društvenih mreža, foruma i feysbooka sa mogućnošću da svaki registrirani korisnik može unositi svoje članke.

 

Anonimni posjetioci mogu pretraživati unesene tekstove izborom prečaca na naslovnoj stranici, klikom na nekog autora, ili izborom kriterija u filteru.

Klikom na nekog autora mogu dobiti sve njegove tekstove koji su posloženi po datumu zadnjeg unosa teksta, ili komentara ispod teksta. Svrha ovakvog sortiranja je potaknuti rasprave kao na forumima.

Registrirani korisnici mogu unositi svoje tekstove, mogu pisati komentare ispod tuđih tekstova, te mogu odabrati autore čije tekstove žele pratiti. Takve autore mogu brzo pronaći iz svoga padajućeg izbornika gdje se nalazi popis svih autora koje taj registrirani korisnik želi pratiti. Pretraživanje svih tekstova mogu vršiti na isti način kao i anonimni korisnici.

 

Kod pisanja novog teksta kojeg registrirani korisnik želi objaviti on svome tekstu pridružuje oznake koje najbolje definiraju njegov tekst. Oznake su podijeljene u 6 grupa i u svakoj grupi može kliknuti jedan, nijedan ili više kriterija (oznaka).

Izbornik CILJANA GRUPA sadrži kriterije kojima označavamo kome smo namijenili tekst.

Izbornik ZANIMANJE označava kriterije kojima pisac označava zanimanje čitatelja kojima je tekst namijenjen.

Izbornik TEMA sadrži teme prema kojima se tekst razlikuje od drugih tema.

Izbornik STIL sadrži kriterije stila na kojim je tekst pisan.

Izbornik EMOCIJE sadrži popis emocija koje tekst izražava, ili potiče.

Izbornik OSJETILA sadrži popis osjeta koje tekst spominje, opisuje ili podržava. Kada pisac odabere sve oznake kojima želi označiti tekst on šalje tekst na stranicu.

 

Od ponuđenih kriterija pisac može izabrati najviše 4 kriterija u svakom izborniku, odnosno po 4 u svakoj grupi oznaka.

 

Nakon što pisac teksta odabere sve kriterije kojima želi označiti svoj tekst, tekst se uploadom šalje u bazu.

 

Tekstovi u bazi se pretražuju na više načina. Prvi način su prečaci; Vijesti, Sport, Tech, Znanost, Kultura. Klikom na ove prečace dobiju se tekstovi iz nekoliko tema koje se mogu svrstati u ove glavne kategorije koje čitatelje najviše zanimaju. Dobiveni tekstovi su sortirani po datumu unosa i po čitanosti.

Drugi način pretrage je po autoru. Od ponuđenih tekstova čitatelj klikom na ima autora dobiva sve tekstove tog autora. Klikom na pojedini tekst on se otvara i može se čitati. Tekstovi su složeni prema datumu unosa i zadnjem komentaru na dotični tekst.

 

Ako čitatelj želi pratiti što i u buduće piše taj autor može stisnuti gumb pretplati me ili prati me, ime autora se stavlja u popis autora koje taj registrirani čitatelj prati. Ovime je čitateljima omogućeno da lakše prate tekstove autora koji pišu o onome što ih zanima i na način koji im odgovara.

 

Klikom na ime pojedinog autora pojavljuju se svi tekstovi tog autora složeni po datumu unosa teksta i zadnjem komentaru. Svrha ovakvog sortiranja je potaknuti raspravu kao kod foruma.

 

Treći način pretrage tekstova je po filteru. U filteru korisnik otvara pojedine grupe oznaka i u svakoj grupi bira kriterije po kojima želi pretraživati tekstove. Kad uz svaki odabrani kriterij unese kvačicu stisne TRAŽI i dobiva tekstove koji zadovoljavaju sve odabrane oznake. Sa odabirom većeg broja kriterija broj pronađenih tekstova se smanjuje, a preciznost pretrage povećava.

 

 

Prednost ovog pretraživača je što se iz baze upisanih tekstova mogu dobiti tekstovi koje čitatelj traži, bez obzira na kojem jeziku su pisani i kada su pisani. Pošto su rezultati kombinacija 6 različitih grupa kriterija preciznost pretrage je do milijun puta veća nego kada se pretražuje samo po jednoj grupi kriterija koji se ne mogu kombinirati. Ako čitatelj dobije rezultate na stranom jeziku lako ih može prevest strojnim Prevoditeljem, najbolje Google translatorom. Ako korisnik unese jedan kriterij u filter dobije popis svih tekstova koji su označeni između ostalih oznaka i sa tom oznakom. Ako izabere i neki drugi kriterij dobije nešto manji popis tekstova koji su označeni sa obje odabrane oznake. Ako odabere i treći kriterij iz filtera dobije još manji popis tekstova koji su označeni sa sve tri oznake. Sa povećanjem broja odabranih kriterija u filteru povećava se preciznost pretrage. Svi odabrani kriteriji povezani su sa operatorom AND ( I ) koji bira tekstove koji imaju sve odabrane oznake. Na ovaj način korisnik može precizno odrediti koja tema ga zanima, kojoj vrsti čitatelja je tekst namijenjen, kakvim stilom je tekst pisan, za koju razinu stručnosti čitatelja je tekst pisan, koje emocije tekst opisuje, spominje ili izaziva, te koja osjetila tekst spominje, opisuje ili vrši podražaj. Ovom logičkom filteru bi se u budućnosti mogao dodati i drugi niz kriterija koje umjetna inteligencija može sama procijeniti kao na primjer odabir po vremenu nastanka teksta i slično. Ovime bi se isključile slabosti raznih novinski portala gdje vijest traje jedan dan nakon čega ju je vrlo teško naći. Time bi se prevladale i slabosti društvenih mreža gdje korisnik obično dobiva obavijest o zadnjem upisu teksta, slike ili filma osoba čiju djelatnost prati, dok je za sve starije obavijesti potreban dodatni trud ručnog traženja bez znanja o tome što se točno traži.

 

Na drugim vrstama portala ovom logičkom filteru bi se mogli dodati i drugi kriteriji kao što su elektroničke vrste tekstualnih, filmskih ili glazbenih sadržaja, kao kod youtube portala, lokacijski ili jezični filteri koje umjetna inteligencija može sama prepoznati i slično. Tako bi se mogla otkloniti slabost postojećih tražilica koje ne mogu pronaći nešto što je netko pisano na drugom jeziku, ili nešto što je skriveno milijunima drugih svježijih sadržaja koji imaju iste naslove i tagove.