“Teknik Derinlikler” Podcast’i: Semantik Arama | sıcak çevrimiçi

Adanali

Member
Bilgi çeşitlidir, yalnızca yazılı metinde değil, aynı zamanda resimlerde, seslerde, videolarda ve çok daha fazlasında bulunur. Klasik sözcüksel aramada bu bilgiye ancak dolambaçlı yollardan çok çaba sarf edilerek erişilebilir hale getirilirken, anlamsal aramada bilgiye yalnızca her dilde değil, resim ve video gibi her modalitede doğrudan erişim sağlanır.


40. bölümde Nico Kreiling, Jina.AI’den Joschka Braun’u konuk ediyor. Jina, geliştiricilerin çok modlu makine öğrenimi uygulamaları oluşturmasına yardımcı olan, Berlin’den bir girişimdir. İlk ikisi birlikte, multimodalitenin, yani metin, görüntü ve ses gibi farklı medya türlerinin etkileşiminin neden geleceğe ait olduğunu açıklıyor. Çok modlu makine öğrenimi modellerinin ilk popüler temsilcileri olarak Clip- ve Dall-E’yi tartışıyorlar ve belge vektörlerini nasıl ürettiklerini açıklıyorlar.

Ardından, yaklaşık en yakın komşu (YSA) aramasını kullanarak oluşturulan vektörlerin yüksek performanslı araması için uygun prosedürler hakkında konuşurlar. Doğrudan HNSWLib, Annoy veya Faiss gibi kitaplıklar kullanılarak veya bir vektör veritabanı içinde bir geri alma yöntemi olarak kullanılabilirler. Veritabanlarının işlemsel ve ölçeklendirme niteliklerini verimli vektör sorgularıyla birleştirir. Joschka ve Nico burada özellikle Weaviate, Milvus ve Qdrant gibi özel vektör veritabanlarının ve ElasticSearch gibi vektör aramalı klasik veritabanlarının avantaj ve dezavantajlarından bahsediyor.

Son olarak, Jina.AI, DocArray, yeni hizmetleri JinaNow ve NLP modelinin gelişimi hakkında konuşmak için geri dönerler.


Önerilen editoryal içerik



Harici içerik, izninizle buraya yüklenecektir.

Harici içeriği şimdi yükleyin





Ek bağlantılar:



(rm)



Haberin Sonu
 
Üst