Apache Solr

Najbolje tražilice s vlastitim hostingom

Najbolje tražilice s vlastitim hostingom
Zna li vaš šef da tražite drugi posao? Jeste li svojoj značajnoj drugoj rekli o nemogućnosti odlučivanja želite li imati djecu ili ne? Znate li vi roditelje o svojoj seksualnoj orijentaciji? Pa, Google i druge glavne tražilice imaju.

"Većina korisnika pretražuje Google dok su prijavljeni, tako da su dostupne sve informacije o njihovom mrežnom životu: pretraživanja YouTubea, e-adrese i prošla povijest pretraživanja", kaže Adam Tauber, vodeći programer meta-pretraživača koji poštuje privatnost Searx.

Naravno, Tor biste mogli koristiti za anonimnost i uvijek brisati sve tragove svoje aktivnosti nakon svakog pretraživanja, ali to bi nakon svake pretrage najvjerojatnije prilično brzo ostarjelo. Umjesto toga, trebali biste razmisliti o instaliranju tražilice s vlastitim hostingom koja može dohvatiti podatke umjesto vas, a da ne otkrije ništa osjetljivo o vama.

Odabrali smo dvije takve tražilice, a također uvodimo tri dodatne tražilice kako bismo vam pokazali da izvrsne alternative vlasničkim tražilicama poput Googlea ili Binga već postoje i jednostavnije ih je instalirati i koristiti nego što mislite.

1. YaCy

YaCy je besplatna distribuirana peer-to-peer tražilica čija je temeljna komponenta napisana na Javi. Budući da su svi YaCy korisnici jednaki i jer tražilica ne pohranjuje zahtjeve za pretraživanje korisnika, cenzura jednostavno nije moguća.

Trenutno YaCy indeksira oko 1.4 milijarde dokumenata u njegovom indeksu zahvaljujući aktivnosti više od 600 vršnjačkih operatora koji mu svaki mjesec daju svoj doprinos. Za usporedbu, indeks Google pretraživanja sadrži stotine milijardi web stranica i velik je preko 100 000 000 gigabajta.

Iako YaCy još uvijek mora prijeći dugačak put prije nego što se može suprotstaviti najvećim centraliziranim tražilicama na svijetu, već se može koristiti kao portal za pretraživanje privatnih intraneta i aplikacija specifičnih za projekt jer YaCy može raditi kao jedan uređaj za pretraživanje bez umrežavanja s drugim kolega.

YaCy se lako može integrirati u bilo koju web stranicu zahvaljujući jednostavnim isječcima koda koji se bez napora mogu kopirati i zalijepiti bez ikakvih izmjena.

2. Searx

Searx je opisan kao hakerabilni meta-pretraživač koji poštuje privatnost. Dostupna je pod GNU Affero General Public Licencom verzije 3, a glavni joj je cilj zaštititi privatnost svojih korisnika tako što nikada ne dijeli IP adrese korisnika ili povijest pretraživanja s tražilicama s kojih prikuplja rezultate.

"Kada upotrebljavate Searx, IP adresa Searxa, slučajni korisnički agent i upit za pretraživanje po zadanom se šalju Googleu", Adam Tauber, zvani asciimoo, objašnjava kako funkcionira njegov mehanizam za metatraženje. “Naravno, možete prilagoditi Searx da prosljeđuje druge dodatne parametre poput jezika pretraživanja ili broja stranice tražene stranice s rezultatima."

Searx automatski blokira sve kolačiće za praćenje koje poslužuju tražilice kako bi spriječio modificiranje rezultata temeljenog na profiliranju korisnika, što može rezultirati iz pretraživača koji pokušava implementirati pretraživanje koje je individualizirano na temelju onoga što motor zna o korisniku. Searx je 100 posto besplatan i svatko ga može mijenjati po potrebi. Možete čak uzeti Searx kôd i pokrenuti mehanizam za metatraženje na vlastitom poslužitelju, što bi definitivno trebalo riješiti sve probleme koji se mogu pojaviti u vezi s dnevnicima.

3. ElasticSearch

ElasticSearch je tražilica bazirana na Lucene, besplatnoj biblioteci softvera za pronalaženje informacija otvorenog koda koju podržava Apache Software Foundation, a izdaje se pod licencom Apache Software License.

ElasticSearch nudi tražilicu za puni tekst s HTTP web sučeljem. Tražilica se može koristiti za pretraživanje svih vrsta dokumenata i može se lako distribuirati na više čvorova.

Moguće je izraditi samo hostiranu tražilicu pomoću ElasticSearch i Docker, a tutorial koji opisuje postupak možete pronaći ovdje.

4. Ambar

Ambar je pretraživač dokumenata otvorenog koda s mnogim korisnim značajkama. Podržava automatizirano indeksiranje, označavanje i trenutno pretraživanje cjelovitog teksta, samo da navedem nekoliko primjera. Jedna od najuzbudljivijih značajki Ambara je sposobnost izvođenja OCR-a na slike i PDF datoteke. Podržani jezici uključuju engleski, njemački, ruski, talijanski, francuski, španjolski, poljski i nizozemski.

Ambar se lako može primijeniti s jednom datotekom za sastavljanje dockera, a kako to možete naučiti ovdje.

5. Apache Solr

Napisan na Javi, Apache Solr je platforma za pretraživanje poduzeća koja uključuje pretraživanje cjelovitog teksta, isticanje pogodaka, fasetirano pretraživanje, indeksiranje u stvarnom vremenu, dinamičko grupiranje i mnoge druge važne značajke. Stvoren je 2004. godine za interni projekt u CNET Networks. CNET Networks ljubazno ga je darovao Apache Software Foundation 2006. godine, gdje je 2007. godine status inkubacije diplomirao u samostalni projekt najviše razine.

Danas je Solr vrlo pouzdana, skalabilna i otporna na greške, platforma za pretraživanje poduzeća koja pokreće značajke pretraživanja i navigacije mnogih najvećih svjetskih internetskih stranica, uključujući DuckDuckGo, eHarmony i BestBuy. Možeš

Kako instalirati i konfigurirati YaCy

Instalacija YaCyja vrlo je jednostavna i traje samo nekoliko minuta jer ne trebate instalirati vanjsku bazu podataka ili web poslužitelj - YaCy dolazi sa svime što je potrebno.

  1. Idite na službenu web stranicu YaCy i preuzmite najnoviji paket za Linux.
  2. Instalirajte runtime okruženje OpenJDK 8.
    • Ako koristite distribuciju zasnovanu na Debianu, upotrijebite sljedeću naredbu: $ sudo apt-get install openjdk-8-jre
    • Ako nije, slijedite upute specifične za vašu distribuciju.
  3. Izdvojite preuzeti paket na željeno mjesto.
  4. Idite u novu mapu i pokrenite „startYACY.sh ”skripta u terminalu.
  5. Trebali biste vidjeti poruku potvrde koja vas obavještava da je YaCy započeo kao demon

Zaključak

Tražilice o nama znaju više nego što bi većina ljudi htjela priznati. Ako želite prestati hraniti velike korporacije sočnim podacima, možete uzeti stvari u svoje ruke i postaviti samostalnu tražilicu za zaštitu vaše privatnosti. Iako samoinstalirane tražilice moraju još puno prijeći kako bi postale u potpunosti upotrebljive, postoji mogućnost da nadmaše Google kao što je i hvatanje je samo stvar privlačenja većeg broja korisnika.

Kako instalirati i igrati Doom na Linuxu
Uvod u Doom Serija Doom nastala je 90-ih nakon izlaska originalnog Dooma. To je bio trenutni hit i od tog vremena nadalje igraća serija dobila je broj...
Vulkan za korisnike Linuxa
Sa svakom novom generacijom grafičkih kartica vidimo da programeri igara pomiču granice grafičke vjernosti i dolaze na korak od fotorealizma. No, bez ...
OpenTTD vs Simutrans
Stvaranje vlastite simulacije prijevoza može biti zabavno, opuštajuće i izuzetno primamljivo. Zbog toga morate isprobati što više igara kako biste pro...