venerdì 16 marzo 2007

mdplab: nuovi arrivi in Biblioteca

Due nuovi libri nella biblioteca di mdplab che pian piano si va popolando!

Avrò tempo per presentarvi quelli che già ci sono ma voglio celebrare l'arrivo degli ultimi due soprattutto perchè li aspettavo ormai da due mesi!

Il primo libro è Understanding Search Engines: Mathematical Modeling and Text Retrieval (Software, Environments, Tools), Second Edition

Il libro parla dei modelli matematici utilizzati (e da utilizzare) nello sviluppo di un buon motore di ricerca inteso in senso generale come un sistema di ricerca del testo e dell'informazione.


Nelle mie intenzioni, la lettura di questo testo è propedeutica a quella del secondo libro: Google's PageRank and Beyond: The Science of Search Engine Rankings

Il libro espone la teoria matematica alla base del più famoso motore di ricerca, Google.

Sono davvero impaziente di dedicarmi a queste letture; in esse si fondono due argomenti come l'Algebra Lineare (materia da me studiata con passione durante il mio corso si studi Universitario di Ingegneria) e i Motori di Ricerca.

Mi auguro di riuscire ad andare oltre le già "iperdivulgate" teorie del Search Engine Optimization.

Vi terrò aggiornati!

2 commenti:

Claudio Iacovelli ha detto...

Il primo libro, che spiega l'intelligenza alla base dei sistemi di gestione della conoscenza, ed il loro collegamento con le tecniche di information retrieval, é certamente interessante.

Suggerisco di valutare, però, l'evoluzione dei sistemi di KM che considerano le mappe concettuali il modo più idoneo al trattamento delle informazioni: il futuro della conoscenza estrapolata dal web é l'interpretazione semantica dei diversi contenuti, e lo sviluppo successivo che si può trarre dal loro studio.

Un esempio concreto proviene dalla società IBM, e dal progetto che ha avviato con la BBC:

http://marketing-intelligence.blogspot.com/2007/03/il-multimedia-search-engine-marvel-ibm.html

http://marketing-intelligence.blogspot.com

Marco Dal Pozzo ha detto...

@Claudio
Grazie per il tuo intervento. Ma hai già letto il libro (il primo) ?

In merito alla tua osservazione "il futuro della conoscenza estrapolata dal web é l'interpretazione semantica dei diversi contenuti" non posso che associarmi al tuo "auspicio".

Posso inoltre dirti che ho trovato qualcosa nel libro in questione: introducendo le tecniche di approssimazione delle matrici termini-documento (term-by-document matrix) si dice come queste tecniche siano strumenti validi anche per la descrizione del contenuto semantico dei testi/documenti facenti parte di una data collezione.

La cosa merita il necessario approfondimento. Conto di postare ancora sui capitoli del libro man mano che andrò avanti; magari sarà interessante discuterne!