laurentius |
|
| CITAZIONE (M(a)rco @ 14/4/2009, 10:53) Rispondo alle domande.
1. il primo lavoro che ho in mente di fare è correlare solo le province con i dati forniti dal ministero degli interni. Trattiamo i primi 4-6 partiti e vediamo come nel corso del tempo ogni provincia si discosta dai dati nazionali. Non abbiamo i dati seggio per seggio, ma in linea di massima dovrebbe già essere un lavoro interessante. In questo modo otterremo un quadro generale delle province più stabili. Questo, in futuro, ci permetterà di tener d'occhio solo alcune di esse quando avremo le risorse adatte per seguire elezioni su scala nazionale.
2. I dati seggio per seggio iniziamo ad averli, di volta in volta, per i centri più importanti (per ora io ho roma, milano, napoli e torino). Potremmo puntare ad avere i dati archiviati per i centri con una popolazione superiore ai 100K abitanti. Non so quante città siano, ma credo una ventina, occhio e croce.
3. Possiamo certamente scegliere di trattare al momento solo Camera. Io al momento mi sto concentrando sulle europee, ma finito il lavoro per le due tornate 1999-2004 possiamo passare a Camera Pol06-Pol08.
4. Questione sito: io ho in mente qualcosa di statico. Una sezione in cui segnalare i link diretti ai dati degli archivi elettorali e nel contempo fornire i tabulati .xls dei nostri lavori, compresi i grafici. Il tutto sempre se abbiamo qualche mega di spazio hosting. Non serve alla fine molto di più, specie se convertiamo tutto in formato .csv o .zip.
5. la mole di dati non è un grosso problema. Già con il mio portatile riesco a trattare senza troppi problemi matrici da qualche centinaio di migliaia di dati. Con un pc con ram da 4gb e con matlab si possono trattare senza troppi problemi matrici fino a 6milioni di dati. Il grosso problema, almeno per me, è avere uno standard di archiviazione unico, in modo tale da lanciare una sola volta lo script che creo. Ecco perchè sottolineo l'importanza di creare almeno per il TP un unico e chiaro sistema di archiviazione dati. I dati che raccogliamo sono sempre catalogati in modi differenti e la cosa, almeno per me, fa perdere un sacco di tempo inutile perchè devo riscrivere tutte le volte i codici (almeno 300 righe). Già con le prime 4 città, trattiamo circa un decimo di tutti i seggi sparsi sul territorio italiano, quindi non è che siamo così messi male. 1. Questo è interessante, e anche di realizzazione piuttosto facile. 2. Le città con più di 100mila abitanti sono 45, da Piacenza in su. Non è immediato farsi dare i dati di 45 comuni; e per quali consultazioni? Pol 08? Pol 06? Eur 04? Amministrative? 3. Sì, va bene 4. Un archivio statico da solo secondo me non è appetibile, ci vogliono entrambe le cose. Cioè un archivio statico e una mappa interattiva che peschi da quell'archivio. 5. Sì, ma il problema è inserire quei milioni di dati manualmente nel nostro archivio.
|
| |