Was ist Mean Pooling über die Tokens?

In meinem vorigen Blog Post bin ich über die Dimension des Vektors gestolpert.  Statt 768 wie aus Ollama generiert waren es plötzlich 3072. Da vierfache, wie mir nach einigen Überlegen aufgefallen ist. Also nocheinmal ein Blick in das ONNX Modell per Netron Da stehts, 768. Der Fehler sitzt v... [Mehr]

Ähnliche Sätze finden mit Embeddings

Es muss nicht immer ein großes LLM sein und schon gar nicht ein API Call in weite Ferne eines Cloud Anbieters, Mein Interesse gilt, wie ich AI lokal betreiben kann. Die Aufgabe: ein Issue Tracker soll bereits erfasste Problemfälle als Liste vorschlagen um doppelte Erfassung zu verhindern, Der Ansa... [Mehr]