La Ricerca Neurale arriva in Apache Solr: Approximate Nearest Neighbor, BERT e altro ancora!
AI/Machine Learning • September 2022
La Ricerca Neurale arriva in Apache Solr: Approximate Nearest Neighbor, BERT e altro ancora!
Explore more
About
La Ricerca Neurale arriva in Apache Solr: Approximate Nearest Neighbor, BERT e altro ancora!
About

Le prime integrazioni di tecniche di Machine Learning con la ricerca hanno permesso di migliorare il posizionamento dei risultati di ricerca (Learning to Rank), ma una delle limitazioni è sempre stata che i documenti dovevano contenere le parole chiave che l’utente digitava nella casella di ricerca per essere trovati.
Ad esempio, la query “tigre” non recuperava documenti contenenti il termine latino “panthera tigris”. Questo problema è chiamato “vocabulary mismatch” e nel corso degli anni è stato mitigato attraverso diversi approcci, come l'espansione delle query e dei documenti.

La Ricerca Neurale (Neural Search) è una tecnica di inteligenza artificiale che consente a un motore di ricerca di raggiungere i documenti semanticamente simili a ciò che ha ricercato l’utente, senza necessariamente contenere l’esatto termine ricercato.
Ciò evita la necessità di lunghi elenchi di sinonimi, apprendendo automaticamente la somiglianza tra i termini e le frasi della collezione, attraverso l’utilizzo di reti neurali profonde (deep neural networks) e la rappresentazione vettoriale.

Questo talk esplora il primo contributo ufficiale di Apache Solr su questo argomento, disponibile a partire da Apache Solr 9.0.
Nel corso dell’intervento verrà fornita una panoramica della Ricerca Neurale: verranno descritte le rappresentazioni vettoriali per le query e i documenti, e il funzionamento della ricerca vettoriale Approximate K-Nearest Neighbor (KNN).
Mostreremo quindi come la ricerca neurale possa essere utilizzata insieme a tecniche di Deep Learning (ad esempio, BERT) o direttamente su dati vettoriali, e come abbiamo implementato questa funzionalità in Apache Solr.

Speaker: Alessandro Benedetti

Meetup London Information Retrieval Meetup

Language
Italian
Level
Intermediate
Length
38 minutes
Type
meetup
About the speaker
About the speaker
Community Codemotion Italia
CommunityCodemotion Italia
Codemotion is the platform that improves the developers’ professional growth by connecting IT professionals, tech communities and companies. We bring the latest tech trends and best practices among the tech community worldwide, help companies to find the perfect dev-match and enhance communities.
Details
Language
Italian
Level
Intermediate
Length
38 minutes
Type
meetup