Back to Question Center
0

Semaltek Bots, Armiarmak eta Crawlers-ekin aurreikusitako aholkuak eskaintzen ditu

1 answers:

Bilaketa-motorea lagunarteko URLak sortzea gain , .htaccess fitxategiak webmasters-ek bere webgunera sartzeko zehaztutako bot-ak blokeatzen uzten dio. Robot horiek blokeatzeko modu bat robots.txt fitxategian dago. Hala eta guztiz ere, Ross Barber, Semalt Bezeroaren Arrakastaren Arduradunak dioenez, eskaera hori jaramonik egiten ez duten zenbait arakatzaile ikusi ditu. Modu onenetariko bat .htaccess fitxategia erabiltzea da zure edukia indexatzea gelditzeko.

Zer dira botu horiek?

Bilaketa-motorrek erabilitako softwarea da interneten eduki berriak ezabatzeko indexatzeko helburuetarako.

Honako zeregin hauek egiten dituzte:

  • Bisitatu dituzun estekatutako web orriak
  • Ikusi zure HTML kodea akatsen
  • Webguneak zure webgunera estekatzen dituztenei zein web orriek zure edukira estekatzeko gordetzen dute
  • Zure edukia indexatzen dute

Hala eta guztiz ere, zenbait bot-ak malicious dira eta zure webgunean helbide elektronikoak eta inprimakiak erabiltzen dituztela nahi ez dituzun mezuak edo spam mezuak bidaltzeko erabiltzen dira. Beste batzuek ere zure kodean segurtasun hutsak bilatzen dituzte.

Zer behar da web arakatzaileak blokeatzeko?

.htaccess fitxategia erabili aurretik, honako hauek egiaztatu behar dituzu:

1. Zure webgunea Apache zerbitzarian exekutatu behar da. Gaur egun, web hosting enpresek beren lanean erdi duina denez, beharrezkoa den fitxategira sar zaitezke.

2. Zure webguneko zerbitzariaren zerbitzari gordinak erregistratzeko sarbidea izan behar duzu, zure webgunea bisitatu duten zein lekutan egon litezkeen jakiteko.

Kontuan izan ez duzula modu kaltegarri guztiak blokeatzeko gai izango, horiek guztiak blokeatzen ez badituzu, lagungarri izango direnak ere. Egunero bote berriak sortzen dira, eta zaharragoak direnak aldatu egiten dira. Modu eraginkorrena zure kodea ziurtatzea da eta bot-ak spam-arentzat zaila bihurtzea da.

Botaren identifikazioa

Bot-ak IP helbide edo bere "Erabiltzaile Agenteen Katea" identifikatzen ditu. HTTP goiburuak bidaltzen dituzte. Adibidez, Google-k "Googlebot" erabiltzen du .

Zerrenda hau behar duzu 302 bot-ekin, jadanik botatzen duzun bot-aren izena badago .htaccess

Beste modu bat zerbitzariaren egunkari fitxategiak deskargatzea da eta testu editore batekin irekitzen ditu. Zerbitzariaren kokapena zerbitzariaren konfigurazioaren arabera aldatu ahal izango da. Ez baduzu aurkitu, bilatu zure web ostalariaren laguntza.

Orri bisitatu den edo bisitaren ordua ezagutzen baduzu, nahigabeko bot batekin errazagoa izango da. Log fitxategia parametro hauei esker bilatu dezakezu .

Behin, nabaritu duzu zein blokeatu behar duzun bot; ondorengo htaccess fitxategian sartu ditzakezu. Kontutan izan bot ez dela nahikoa gelditzeko. IP edo izen berri batekin itzuli daiteke .

Nola blokeatu

.htaccess fitxategiaren kopia bat deskargatu. Egin beharrezkoak diren segurtasun kopiak.

1. metodoa: IPren bidez blokeatzea

Kode kode hau blokeatzen du IP helbidea 197.0.0.1

erabiliz.

Agindua ukatu, baimendu

197.0.0.1

ukatu.

Lehen lerroan zerbitzariak zehaztutako ereduak bat datozen eskaera guztiak blokeatuko ditu eta beste guztiak onartuko ditu.

Bigarren lerroan zerbitzariak 403: debekatuta dagoen orria igorri dio

2. metodoa: erabiltzaileen agenteen blokeoa

Modurik errazena Apache-ren berridazketa motor

erabiltzea da.

BerrekinEngine On

RewriteCond% {HTTP_USER_AGENT} BotUserAgent

RewriteRule. - [F, L]

Lehen lerroan rewrite modulua gaituta dago. Bi lerroa arauari aplikatzen zaion baldintza da. "F" 4 lerroan zerbitzariak 403 itzultzen dio: Debekatuta dago "L" esan nahi du hau da azken araua.

.htaccess fitxategia zure zerbitzarian kargatuko duzu eta lehendik dagoenaren gainidatzi. Denborarekin, Bot-en IPa eguneratu beharko duzu. Errore bat gertatuz gero, egin duzun kopia egin.

November 29, 2017
Semaltek Bots, Armiarmak eta Crawlers-ekin aurreikusitako aholkuak eskaintzen ditu
Reply