Questa settimana ci concentreremo su una delle classi di algoritmi più importanti per la GraphDataScience, ossia i Node Embeddings. In particolare, vi parlerò di FastRP (extended) che permette di integrare dentro un embedding sia le informazioni delle feature del nodo che della struttura e delle relazioni dei nodi stessi, permettendone l'uso anche in algoritmi di ML sia interni (come quello di Node Classification o di Link Prediction della GDS library) che esterni a Neo4j.
L’applicabilità di un algoritmo di node embedding è molto elevata, proprio perché può essere utilizzato come ponte tra il mondo dei dati connessi (e quindi dei grafi) con il mondo del machine learning. Inoltre, gli embedding possono essere utilizzati per confrontare i nodi tra di loro tramite algoritmi di similarità più tradizionali come KNN o cosine similarity, come partenza per effettuare feature engineering o per permettere una visualizzazione dei nodi sotto forma di vettori grafici o in uno spazio bidimensionale.
Guarda questa sessione di 10 minuti, in cui parlerò di teoria e mostrerò due semplici esempi di utilizzo di FasRP.