Bayes-Datenbank ;Fragen zu Spamfilter

Moderator: Securepoint

Gesperrt
Dralle
Beiträge: 28
Registriert: Di 16.10.2007, 11:55
Wohnort: Stuttgart

Bayes-Datenbank ;Fragen zu Spamfilter

Beitrag von Dralle »

Hallo zusammen,

Ich bemerke seit gestern ein "Problem" beim Spamfilter das für mich doch einige Fragen aufwirft und sich wie folgt zeigt:

Wir bekommen mehr Spammails, worauf ich die BaysFilter-Werte geändert habe um "strenger" zu prüfen.
Die Prüfung schien zuerst tatsächlich besser zu greifen, jedoch hatte ich kurze Zeit später mails im Ham die sonst immer als Spam deklariert wurden. Ich ignorierte dies zuerst und habe manuell die mails als Spam deklariert.

Über Nacht summierten sich die Spammails im HAM :shock: und ich schaute mir einfach mal aus Interesse&Vermutung die database.db-Größe an. Sie war groß, was mich eigentlich vermuten lässt das sie durch die Veränderung der Werte nicht geleert wird und ich den Filter neu anlernen muß!? Rückstellung zu den alten Werten brachte nichts! Auch Restart etc. ;(

Hier meine Fragen:

1. Wenn die Filterwerte am Bayes Filter geändert werden....bleibt die DB bestehen und ist das sinnvoll ? ..oder wäre es besser sie zu löschen?

2. Welche Werte sind sinnvoll am Bayes Filter bzw. optimal?

Welche Kombinatinen sind "aggresives" Filtern und welche eher moderat?

3. Kann jemand von Euch mein beschriebenes Problem nachvollziehen und ggf. helfen!? Ich wollte es eigentlich vermeiden das ich die DB lösche, da sie bisher
im Bereich von 98% etwa lag und sehr gute Dienste verrichtete!
Wenn die Menschen nur über Dinge reden würden, von denen Sie etwas verstehen -
das Schweigen wäre bedrückend.

carsten
Beiträge: 644
Registriert: Fr 05.10.2007, 12:56

Beitrag von carsten »

Moin,

das ist ein schwieriges Thema, denn die Filterung gestaltet sich im Allgemeinen komplett transparent.

1. Es ist richtig, das die DB bestehen bleibt. Wenn Sie es mit einer Neuen versuchen wollen, machen Sie einfach von der alten ein backup, local sowie auf Ihrem Rechner. Beenden Sie den Dienst und löschen sie die aktuelle, wenn Sie den Dienst neu starten wir einen leere erstellt!

2. Als optimal haben sich die Werte über den Button " Standardwerte" erwiesen. "Aggresiev" würde ich sagen ist, wenn der Faktor um Spamabzugrenzen auf 2 gestellt wird.

3. Siehe 1, wenn eine neue Spamwelle mit neuen Wörtern kommt, muss der Spamfilter dies natürlich erst lernen.
There are 10 types of people in the world... those who understand binary and those who don\'t.

Dralle
Beiträge: 28
Registriert: Di 16.10.2007, 11:55
Wohnort: Stuttgart

Beitrag von Dralle »

Momentane Situation:

Die Datenbank habe ich mal gelöscht und trainiere den Filter neu.

Frage: "Faktor um Spam abzugrenzen auf 2 "

Das habe ich bereits eingestellt, nun liegt im Ham eine mail mit der Bay-Bewertung von "8". Das dürfte doch gar nicht passieren oder irre ich da!?

... oder muß ich den Bay-Wert tatsächlich als Faktor sehen ? Original liegt hier meines Wissens der Wert beim Multiplikator "10" was bedeuten würde, das die eingestellte "2" als Faktor einem Bay-Wert von "20" entspricht!? :roll:


Nachtrag: Ich seh gerade im WI, das eben eine mail sogar mit dem Wert 44 im Ham landet! Das verwirrt jetzt doch etwas stark :roll:

Ps.: Alle angesprochenen mails sind tatsächlich Spam!
Zuletzt geändert von Dralle am Fr 25.07.2008, 12:37, insgesamt 1-mal geändert.
Wenn die Menschen nur über Dinge reden würden, von denen Sie etwas verstehen -
das Schweigen wäre bedrückend.

Dralle
Beiträge: 28
Registriert: Di 16.10.2007, 11:55
Wohnort: Stuttgart

Beitrag von Dralle »

Neuer Stand:
Maßgebend ist der Schwellenwert den man selbst einstellt ! ;)

.....da dieser standardmäßig auf 70 steht, kommen mails mit einer Bewertung bis 69 in den HAM, die drüber liegen in den SPAM!

Mein Problemchen scheint jetzt gelöst zu sein ^^

Ps.:
Auch die Aussage zum Faktor von mir war richtig.
Jetzt steht der angelernte Filter bei uns wieder wie eine "Eins" und ist auf "sehr aggressiv" eingestellt :mrgreen:
Wenn die Menschen nur über Dinge reden würden, von denen Sie etwas verstehen -
das Schweigen wäre bedrückend.

Gesperrt