Machine Learning for Retrieval

This research area applies machine learning techniques to improve various aspects of information retrieval, from ranking and matching to cross-market adaptation and personalization. Key work includes developing neural ranking models that combine local and distributed text representations, creating density-based user representations using Gaussian process regression for multi-interest personalization, and learning to rank with labeled features rather than document labels. The research encompasses cross-market model adaptation using pairwise preference data, methods for transferring retrieval knowledge across collections with non-overlapping vocabularies, and techniques for generating quick links and proactive suggestions.

Publications

Optimizing Retriever Selection for LLMs via Learning to Rank

T.-E. Kim and F. Diaz

SIGIR, 2026

Diversification as Risk Minimization

R. Takehi, F. Diaz, T. Sakai

WSDM, 2026

RankList -- A Listwise Preference Learning Framework for Predicting Subjective Preferences

A. R. Naini, F. Diaz, C. Busso

AAAI, 2026

LTRR: Learning To Rank Retrievers for LLMs

T.-E. Kim and F. Diaz

SIGIR LiveRAG Workshop, 2025

Density-based User Representation using Gaussian Process Regression for Multi-interest Personalized Retrieval

H. Wu, O. Meshi, M. Zoghi, F. Diaz, X. Liu, C. Boutilier, M. Karimzadehgan

NeurIPS 2024

Learning to Match Using Local and Distributed Representations of Text for Web Search

B. Mitra, F. Diaz, N. Craswell

WWW 2017

Learning to Rank with Labeled Features

F. Diaz

ICTIR 2016

Generalized Link Suggestions via Web Site Clustering

J. Seo, F. Diaz, E. Gabrilovich, V. Josifovski, B. Pang

WWW 2011

Cross-Market Model Adaptation with Pairwise Preference Data for Web Search Ranking

J. Bai, F. Diaz, Y. Chang, Z. Zheng

COLING 2010

Pseudo-aligned multilingual corpora

F. Diaz and D. Metzler

IJCAI 2007