Risorse Data Science

Una serie di Jupyter Notebooks per studiare le funzioni principali di Pandas ed altri strumenti per la Data Science Lezione 01: Introduzione a Pandas Lezione 02: Gestire i duplicati e concatenare i dati Lezione 03: Raggruppare i dati Lezione 04: Data Visualization Lezione 05: Analisi Statistica Lezione 06: Cenni di statistica Lezione 07: Correlazione ACCEDI …

Algoritmi di ottimizzazione

Nei casi più semplici un ottimizzatore ci permette di conoscere il massimo ed il minimo di una funzione: nello specifico quei parametri che passati alla funzione ci permettono di trovarne il suo valore massimo ed il suo valore minimo. Nel caso di una o due variabili l’individuazione del punto minimo o massimo è abbastanza facile …

La regressione lineare

Tra i più semplici modelli di apprendimento supervisionati c’è quello basato sulla regressione lineare. Il funzionamento di una semplice regressione lineare è alla base di molto più complessi come le reti neurali artificiali. In poche parole quello che fa la regressione lineare e stabilire una correlazione tra una variabile dipendente y ed una variabile indipendente …

A cosa serve il machine learning?

Negli ultimi anni si è sentito parlare sempre più spesso di Machine Learning e di Intelligenza Artificiale diventando uno dei temi più attuali. In realtà una prima definizione del Machine Learning è stata fatta nel 1950 da Arthur Samuel, uno dei pionieri dell’intelligenza artificiale, che definiva questa branca dell’informatica in questo modo: Il machine learning …

Trovare i selettori XPath

Abbiamo visto nel pezzo precedente cosa sono i selettori XPath e perchè sono importanti per trovare i dati che vogliamo all’interno di un documento HTML. Ma questo tipo di selettori hanno una sintassi particolare che all’inizio può essere difficile da comprendere, quindi: come possiamo fare per conoscere i selettori giusti da utilizzare? Se andiamo a …

Estrazione dei dati con Scrapy Shell

Il metodo migliore per imparare come estrarre i dati da una pagina HTML usando i selettori CSS o XPath è quello di lanciare la Scrapy Shell da terminale andando ad indicare la pagina che vogliano analizzare: scrapy shell ‘http://quotes.toscrape.com/page/1/’ NOTA: Nel caso di OS Windows ricordarsi di utilizzare le doppie virgolette: # Doppie virgolette per …

Creare un progetto in Scrapy

Andiamo a vedere come realizzare il nostro primo progetto in Scrapy, supponiamo che abbiate già provveduto all’installazione, ma se così non fosse è sufficiente utilizzare il gestore di pacchetti python pip scrivendo nel nostro terminale: pip install scrapy Molto semplice, in pochi istanti il nostro sistema sarà pronto per accettare il nostro primo comando con …

Python, Requests e Tor proxy

Nel caso in cui avessimo necessita di utilizzare un proxy per estrarre pagine web in modo anonimo possiamo utilizzare l’accoppiata Requests e Tor. Request è una libreria HTTP di Python che permette di effettuare in modo semplice delle chiamate ad un web server. Tor è un software che permette di instaurare un servizio di comunicazione …

Esempio di Scraper con Python e Request-HTML

In questo articolo vedremo come creare un semplice scraper che ci permetterà di estrarre i alcuni date da un sito web/portale per la ricerca di attività commerciali in base alla località ed a uno o più termini di ricerca. Per effettuare la nostra estrazione andremo ad utilizzare la libreria Requests-HTML, una versione riadattata e più …