CCK GROUP
Willkommen Gast. Bitte einloggen oder registrieren.
September 07, 2010, 12:53:34

Einloggen mit Benutzername, Passwort und Sitzungslänge
Suche:     Erweiterte Suche
Jetzt kostenlos im CCK Webkatalog
eintragen!
1223 Beiträge in 183 Themen von 62 Mitglieder
Neuestes Mitglied: ktmheizer
* Übersicht Hilfe Kalender Login Registrieren
Sponsored CCK Board links
Neue Inhalte 1 Beiträge in
1 Themen
Letzter Beitrag am 27. September 2005, 12:00:00
in Willkommen bei der CCK GROUP von Google
+  CCK GROUP
|-+  Internet
| |-+  Suchmaschinenoptimierung (SEO) (Moderator: nülle)
| | |-+  überprüfung von useragenten und bots + more
0 Mitglieder und 1 Gast betrachten dieses Thema. « vorheriges nächstes »
Seiten: [1] 2 3 ... 5 Nach unten Drucken
Autor Thema: überprüfung von useragenten und bots + more  (Gelesen 18463 mal)
MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« am: September 18, 2005, 21:54:27 »

Es gibt eine neue Beta Version.

Was ist neu?
Das Programm erstellt automatisch eine .htaccess mit auszuschließenden Useragenten.
Das ist schon ganz schön viel Arbeit, die einem abgenommen wird.
Es kann auf Wunsch eine .htaccess erzeugt werden, die Downloads vor Deeplinking schützt.
Es wurden Partner ins Programm übernommen.
Mini Erklärung von Statuscodes.

Was war alt?
Überprüfung von einzelnen Bots/Useragenten auf deren Zugriff auf die Webpräsenz.
Überprüfung von Bots/Useragenten anhand einer Botlist auf deren Zugriff auf die Webpräsenz.

Alle Feature sind includet!

Was kommt bald?
Geplant ist mit dem Webservice von Google zu kommunizieren.
Automatische Erstellungen von Redirektoren mittels Formular.

Mal sehen was für Ideen noch kommen ... so lange bleibt es eine Beta  Wink


Last EDIT
16.11 / 0:27



« Letzte Änderung: Dezember 02, 2005, 22:01:51 von MasterX » Gespeichert

Mr.On
Gast
« Antwort #1 am: September 22, 2005, 11:15:52 »

So habs mir mal angeschaut und ist auf den ersten Blick klasse.

Die .htaccess wird auch schon mal prima generiert. Solang die Liste noch nicht astrein ist, wäre es vielleicht hilfreich wenn man die bots aussuchen bzw. anklicken kann die ausgeschlossen werden sollen und danach die .htaccess gestaltet wird.

Was meinst Du oder Ihr.
Gespeichert
MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #2 am: September 22, 2005, 14:55:47 »

Solang die Liste noch nicht astrein ist, wäre es vielleicht hilfreich wenn man die bots aussuchen bzw. anklicken kann die ausgeschlossen werden sollen und danach die .htaccess gestaltet wird.

Ja das liese sich einrichten  Cool
Gespeichert

MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #3 am: September 22, 2005, 20:22:30 »

@Mr:on
habe Deinen Vorschlag eingebaut.

Man hat jetzt die Möglichkeit selber zu entscheiden, welche Bots in die .htaccess geschrieben werden. (Einfach den Haken in der Checkbox des Useragenten entfernen, alle anderen werden reingeschrieben)
Weiterhin kann man jetzt eigene *.bot Files erstellen und diese dann laden und prüfen lassen.
Ein Bug war mir aufgefallen bei der Erstellung der .htaccess.

Habe ich gefixt.

Die aktuelle Version habe ich im ersten Posting angehangen.

Wäre natürlich erfreut, wenn es Feedback und weitere Vorschläge gibt.

greetz
MX
Gespeichert

CN-Techniker
Full Member
***

Karma: 3
Offline Offline

Geschlecht: Männlich
Beiträge: 194


« Antwort #4 am: September 22, 2005, 21:34:45 »

Ich vermisse Versionsnummern. Wäre cool, wenn du die mit einpflegst. Der Grund dafür ist recht einfach... man sieht, ob man eine Aktuelle Version hat, oder eben nicht. Die, die ich mir eben runtergeladen habe sieht genauso aus, wie die davor.

Noch aufgefallen sind mir folgende Dinge.

Gibt man eine Bot-Liste an und ein Target, so vergisst das Tools diese, wenn man im Tool ein bisschen rumklickt. Wenn es sich das merken würde, wäre das klasse.
Man kann die Prüfung nicht vorzeitig abbrechen, dass wäre aber schon nicht schlecht.

Das erzeugen der .htaccess ist übrigens super. Aber warum muss ich dafür erst den Test durchlaufen. Das ist schade. Würde es nicht sinn machen, den Test und die Erzeugung voneinander abzukoppeln?

Gruß, Holger

Gespeichert
MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #5 am: September 22, 2005, 21:59:53 »

Hi Holger,

Zitat
Ich vermisse Versionsnummern. Wäre cool, wenn du die mit einpflegst. Der Grund dafür ist recht einfach... man sieht, ob man eine Aktuelle Version hat, oder eben nicht. Die, die ich mir eben runtergeladen habe sieht genauso aus, wie die davor.

Die zu Grunde liegende Version ändert sich ja nicht bei den kleinen Änderungen. Es ist halt noch die 1.0 Beta, es ändert sich aber ständig die Dateiversion, die kann ich anzeigen lassen.

Zitat
Gibt man eine Bot-Liste an und ein Target, so vergisst das Tools diese, wenn man im Tool ein bisschen rumklickt. Wenn es sich das merken würde, wäre das klasse.

Das kann ich ändern, kein Problem.

Zitat
Man kann die Prüfung nicht vorzeitig abbrechen, dass wäre aber schon nicht schlecht.

Werde mir das Problem anschauen  Cool

Zitat
Aber warum muss ich dafür erst den Test durchlaufen. Das ist schade. Würde es nicht sinn machen, den Test und die Erzeugung voneinander abzukoppeln?

Die Grundlage zur Erzeugung der .htaccess war ja die vorgegebene Botliste.

Jetzt kann man ja seine eigenen (und auch getesteten) Botlisten erstellen, da bietet es sich an den test nur Wahlweise durchzuführen.

Werde das alles in der nächsten Version berücksichtigen!

Danke für das Feedback.

grüße
MX



Gespeichert

CN-Techniker
Full Member
***

Karma: 3
Offline Offline

Geschlecht: Männlich
Beiträge: 194


« Antwort #6 am: September 22, 2005, 22:30:18 »

Ich hab die erzeugte htaccess bei mir eingefügt. Das Ergebnis war ein "500 Internal Server Error"  Nanü, woran liegt denn das?
Gespeichert
MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #7 am: September 22, 2005, 23:24:12 »

Ohh... 

das kann ich erst morgen testen ...

habe erstmal den download runter genommen , es liegt an den Leerzeichen in den Namen der Bots.



« Letzte Änderung: September 22, 2005, 23:27:32 von MasterX » Gespeichert

MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #8 am: September 23, 2005, 13:52:19 »

Ich habe jetzt die Fehler mit der .htaccess korrigiert.
Sollte jetzt eigentlich keinen 500 Internal Server Error mehr bringen.

Habe jetzt mal angefangen eine saubere Botliste zu erstellen (liegt im Archiv bei). Wer Lust hat kann diese erweitern bzw. bearbeiten. Habe das Formular zum Erstellen von Botlisten ein wenig erweitert.

Vielleicht kann das mal jemand testen und Feedback hinterlassen.

thx
Gespeichert

CN-Techniker
Full Member
***

Karma: 3
Offline Offline

Geschlecht: Männlich
Beiträge: 194


« Antwort #9 am: September 23, 2005, 21:22:46 »

 Grin keine Ahnung was jetzt klemmt. Jetzt kommt die Testpage vom Webserver. Müssten da nicht die * in der htaccess sein? Vor und hinter den Bots.
Gespeichert
MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #10 am: September 23, 2005, 21:33:49 »

Puhh...

So sieht die momentan erstellte .htaccess aus.

Zitat
########################################################
#            .htaccess generatet by CCK GROUP          #
# Please visit http://board.cck-group.info for Support #
########################################################

RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^BackWeb [OR]
RewriteCond %{HTTP_USER_AGENT} ^Bandit [OR]
RewriteCond %{HTTP_USER_AGENT} ^BatchFTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR]
RewriteCond %{HTTP_USER_AGENT} ^Collector [OR]
RewriteCond %{HTTP_USER_AGENT} ^Copier [OR]
RewriteCond %{HTTP_USER_AGENT} ^Custo [OR]
RewriteCond %{HTTP_USER_AGENT} ^DISCo\ Pump [OR]
RewriteCond %{HTTP_USER_AGENT} ^Download\ Demon [OR]
RewriteCond %{HTTP_USER_AGENT} ^Download\ Wonder [OR]
RewriteCond %{HTTP_USER_AGENT} ^eCatch [OR]
RewriteCond %{HTTP_USER_AGENT} ^EirGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR]
RewriteCond %{HTTP_USER_AGENT} ^Express\ WebPictures [OR]
RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR]
RewriteCond %{HTTP_USER_AGENT} ^FileHound [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mass\ Downloader [OR]
RewriteCond %{HTTP_USER_AGENT} ^PageGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^Papa\ Foto [OR]
RewriteCond %{HTTP_USER_AGENT} ^TheSuBot/0\.1\ (www\.thesubot\.de)
RewriteRule ^.* - [F]

Ich habe die jetzt selber hochgeladen, da gibt es keine probs -> beispiel

Grin keine Ahnung was jetzt klemmt. Jetzt kommt die Testpage vom Webserver. Müssten da nicht die * in der htaccess sein? Vor und hinter den Bots.


eigentlich nicht, wie sieht denn Deine .htaccess aus?

gruß
Gespeichert

CN-Techniker
Full Member
***

Karma: 3
Offline Offline

Geschlecht: Männlich
Beiträge: 194


« Antwort #11 am: September 23, 2005, 22:26:03 »

Wenn ich die vom Tool erstellte ACL reinkopiere, sieht die so aus:

Zitat
RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^BackWeb [OR]
RewriteCond %{HTTP_USER_AGENT} ^Bandit [OR]
RewriteCond %{HTTP_USER_AGENT} ^BatchFTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR]
RewriteCond %{HTTP_USER_AGENT} ^Collector [OR]
RewriteCond %{HTTP_USER_AGENT} ^Copier [OR]
RewriteCond %{HTTP_USER_AGENT} ^Custo [OR]
RewriteCond %{HTTP_USER_AGENT} ^DISCo\ Pump [OR]
RewriteCond %{HTTP_USER_AGENT} ^Download\ Demon [OR]
RewriteCond %{HTTP_USER_AGENT} ^Download\ Wonder [OR]
RewriteCond %{HTTP_USER_AGENT} ^eCatch [OR]
RewriteCond %{HTTP_USER_AGENT} ^EirGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR]
RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR]
RewriteCond %{HTTP_USER_AGENT} ^Express\ WebPictures [OR]
RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR]
RewriteCond %{HTTP_USER_AGENT} ^FileHound [OR]
RewriteCond %{HTTP_USER_AGENT} ^Mass\ Downloader [OR]
RewriteCond %{HTTP_USER_AGENT} ^PageGrabber [OR]
RewriteCond %{HTTP_USER_AGENT} ^Papa\ Foto [OR]
RewriteCond %{HTTP_USER_AGENT} ^mirago [OR]
RewriteRule ^.* - [F]

#<Simplified URL Hack>
RewriteEngine on
RewriteCond %{REQUEST_FILENAME}   !-f
RewriteRule ^.*\.(htm|html) loadpage.php [L]
RewriteRule ^$ loadpage.php [L]
#</Simplified URL Hack>
Gespeichert
MasterX
Administrator
Sr. Member
*****

Karma: 1
Offline Offline

Geschlecht: Männlich
Beiträge: 370



WWW
« Antwort #12 am: September 24, 2005, 11:15:57 »

Was mir gleich aufgefallen ist, Du schaltest 2x die RewriteEngine an, am Beginn und in Deinem Hack. Das ist aber nicht richtig.
RewriteEngine on muss zum Beginn der htaccess platziert werden.

Zitat
RewriteEngine on
RewriteBase /
RewriteCond %{HTTP_USER_AGENT} ^BackWeb [OR]
RewriteCond %{HTTP_USER_AGENT} ^Bandit [OR]
RewriteCond %{HTTP_USER_AGENT} ^BatchFTP [OR]
RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR]
RewriteCond %{HTTP_USER_AGENT} ^Collector [OR]
.........
RewriteRule ^.* - [F]

RewriteCond %{REQUEST_FILENAME}   !-f
RewriteRule ^.*\.(htm|html) loadpage.php [L]
RewriteRule ^$ loadpage.php [L]


greetz
MX
Gespeichert

CN-Techniker
Full Member
***

Karma: 3
Offline Offline

Geschlecht: Männlich
Beiträge: 194


« Antwort #13 am: September 24, 2005, 13:54:44 »

Ups, stimmt. War bisher aber kein Problem  Wink
Gespeichert
Mr.On
Gast
« Antwort #14 am: September 24, 2005, 15:51:02 »

Hallo,

also bei mir funzt das alles super.

Vielleicht muss man wieder auf bestimmte Operatoren achten wie auch bei Mod_Rewrite. Da ist ja jeder Provider anders.

Ciao Mr.On
Gespeichert
Seiten: [1] 2 3 ... 5 Nach oben Drucken 
« vorheriges nächstes »
Gehe zu:  


Impressum

Powered by SMF 1.1.1 | SMF © 2006, Simple Machines LLC
Seite erstellt in 0.119 Sekunden mit 22 Zugriffen.