ForumCommunity

Correlazioni Eur04-Cam06-Cam08 (Eur09 a breve)

« Older   Newer »
  Share  
M(a)rco
view post Posted on 16/4/2009, 08:07




Ragazzuoli,

sto iniziando a trattare Cam08 per trovare le correlazioni con i voti nazionali di quella tornata, Provincia per Provincia, al fine di scovare quelle più rappresentative, stabili ed indicative.

Per rappresentative intendo: considerati i primi 5 partiti di ogni provincia per numero di voti, quanto le loro percentuali si discostano dai primi 5 partiti a livello nazionale?

Prima di bombardarvi di dati e grafici come al mio solito (e qualcuno inizierà pure ad odiarmi...ihihih), secondo voi, come sono andate le cose con questa prima tornata?

Ovvero, sarà riuscito il nostro supereroe a trovare qualcosa di buono?
E se sì, quali secondo voi le province più rappresentative?

 
Top
laurentius
view post Posted on 16/4/2009, 09:43




c'erano alcune province rappresentative mi pare, tipo Lucca, Padova...
 
Top
M(a)rco
view post Posted on 16/4/2009, 10:35




Ecco a voi quanto da me trovato sinora per CAMERA_2008

Grafici dispersione*** provincia per provincia dei primi 5 partiti per numero di voti rispetto alle percentuali dei primi 5 partiti su scala nazionale(divisi in gruppi di due)

image
image

Distribuzione delle dispersioni dei primi 5 partiti provinciali (cumulativo)

image

Distribuzione delle dispersioni dei primi 5 partiti provinciali (partito per partito)

image

Correlazioni



Valor Medio di correlazione su tutte le province

0.95435775984905

Deviazione standard

0.05519876264160


Intervalli di confidenza per l'analisi delle correlazioni

rho_value = [0.98 0.99 0.995 0.998 0.999]

Vi do qui i risultati delle province più significative per gli ultimi due livelli di confidenza

Correlazione tra 0.999 ed 1

'torino'
'rimini'
'potenza'
'vibo valentia'
'carbonia iglesias'

Correlazione tra 0.998 ed 1

'torino'
'rimini'
'lucca'
'massa carrara'
'potenza'
'cosenza'
'vibo valentia'
'carbonia iglesias'
'medio campidano'
'ogliastra'

Qui le distribuzioni delle percentuali dei primi 5 partiti per la categoria 0.999-1, confrontata con le percentuali dei primi 5 partiti a livello nazionale.
Ho riportato anche il valor medio di dispersione e la relativa deviazione standard. Ciò che è importante capire in questi grafici è che è la deviazione media che conta, non tanto il valore partito per partito. Ci saranno province che azzeccano meglio il singolo partito, ma poi scazzano gli altri 4 (e tutte le altri possibili casistiche). La correlazione di queste 5 province è la più alta registrata su scala nazionale su TUTTI e 5 i partiti. Si può anche procedere con l'analisi dei soli due o tre primi partiti, se vogliamo puntare ad un'analisi più stile "maggioritario".

image
image
image
image
image


Infine, analisi di Fit sulle correlazioni e dispersioni per tutte le province, giusto per avere un'idea di come si comportano nel complesso

image
image


***: Dispersione = (A - B)/B
A = valore provincia
B = valore nazionale
 
Top
M(a)rco
view post Posted on 20/4/2009, 01:48




EUROPEE_2004

Grafici dispersione provincia per provincia dei primi 5 partiti per numero di voti rispetto alle percentuali dei primi 5 partiti su scala nazionale(divisi in gruppi di due)

image
image

Distribuzione delle dispersioni dei primi 5 partiti provinciali (cumulativo)


image



Distribuzione delle dispersioni dei primi 5 partiti provinciali (partito per partito)

image


Per le Europee 04, i coefficienti di correlazioni risultano essere un po' più bassi in media

Valor Medio: 0.94991830916797
STD: 0.04498991359256

Considerando gli stessi intervalli di confidenza per la correlazione

rho_value = [0.98 0.99 0.995 0.998 0.999]

solo i primi 3 danno responso positivo. Infatti il massimo di correlazione è 0.99794705086379
che si ottiene per Lucca.

Do qui i risultati per l'intervallo

0.995-1

'Rovigo'
'Lucca'
'Reggio Calabria'

image
image
image


Nell'intervallo 0.99-1 si hanno le seguenti province

'Mantova'
'Imperia'
'Rovigo'
'Ferrara'
'Rimini'
'Lucca'
'Massa-Carrara'
'Ascoli Piceno'
'Pescara'
'Teramo'
'Avellino'
'Reggio Calabria'
'Nuoro'

Nell'intervallo 0.98-1 si hanno le seguenti province

'Torino'
'Mantova'
'Imperia'
'Savona'
'Trento'
'Rovigo'
'Gorizia'
'Trieste'
'Ferrara'
'Forlì-Cesena'
'Parma'
'Rimini'
'Arezzo'
'Lucca'
'Massa-Carrara'
'Ascoli Piceno'
'Macerata'
'Pesaro e Urbino'
'Pescara'
'Teramo'
'Avellino'
'Napoli'
'Salerno'
'Bari'
'Reggio Calabria'
'Caltanissetta'
'Nuoro'

Appena ho CAMERA_2006 inizio l'incrocio dei dati.

Sembra perciò che sinora Lucca, Rimini, Torino siano le più stabili sulle 2 tornate.

Edited by M(a)rco - 20/4/2009, 03:04
 
Top
laurentius
view post Posted on 20/4/2009, 11:08




Mi sembra strano perché tutte e 3 sono nettamente più a sinistra del dato nazionale.
 
Top
Animamigrante
view post Posted on 20/4/2009, 12:31




CITAZIONE (laurentius @ 20/4/2009, 12:08)
Mi sembra strano perché tutte e 3 sono nettamente più a sinistra del dato nazionale.

Evidentemente sono "stabilmente" più a sinistra.
Non ci vedo niente di particolarmente strano... scusa, se da una parte l'andamento si mantiene costante con, che so, un 5% in più per la sinistra ed un 5% in meno alla destra, non dovrebbe andare benissimo uguale come campione statistico, una volta corretto? :huh:
 
Top
M(a)rco
view post Posted on 20/4/2009, 16:48




QUOTE (laurentius @ 20/4/2009, 12:08)
Mi sembra strano perché tutte e 3 sono nettamente più a sinistra del dato nazionale.

Forse l'analisi che sto facendo non vi è ancora ben chiara.

Io non guardo i partiti, io guardo solo le percentuali dei primi 5 partiti in ogni provincia, di qualunque colore essi siano.

Poi confronto quelle percentuali con i dati nazionali.

Emerge che, e ripeto ancora una volta, a prescindere dal colore del partito, le percentuali dei primi 5 partiti si mantengono stabili tra provincia e nazionale in alcune zone.

E quelle province che vi ho elencato secondo range di valori di correlazione lo fanno.

Voglio dire, provare per credere. I dati reali li trovate sul sito del ministero. Confrontateli con i dati nazionali e scoprirete che non vi è nulla di artificioso. Pura analisi di correlazione.



Per di più vi ho anche fornito i grafici delle province in questione in relazione ai dati nazionali...
 
Top
M(a)rco
view post Posted on 20/4/2009, 19:18




Come richiesto da Lollo, ecco qui una prova del test.

Ciò che ho fatto è la seguente cosa

1. Media delle dispersione su CAMERA_2008 e EUROPEE_2004
2. Applicare questo risultato alla provincia in CAMERA_2008 e confrontarla con il dato nazionale CAMERA_2008

Questi i valori CAMERA_2008 Nazionali

37.38800000000000
33.17400000000000
8.29700000000000
5.62400000000000
4.37100000000000

Lucca



36.20654602805623
33.13626621105847
5.97829737774244
4.17926442240018
4.13615918340649


Rimini



36.00706426079250
32.70235309009089
7.61167790114222
4.59715189992866
4.89508452372283

Torino



35.95209596242407
34.93923057781541
9.32353660587785
5.13732084893822
4.58138605040714
 
Top
M(a)rco
view post Posted on 20/4/2009, 19:38




Qui ho fatto la prova considerando la media delle dispersioni CAM08 e EUR04 su tutte e tre province ed applicare il risultato su CAM08

Lucca



36.93141805480264
34.99698790821572
6.22297308480306
3.98201754913473
3.94251033887281

Rimini



37.79739024166623
34.37779763217376
6.80180121141638
4.17892151558153
4.03500967786691

Torino



33.44472527178532
31.18721906254625
9.93396635554585
5.84715746485234
5.60083723686847


Facendo la media di queste province si ottengono i seguenti risultati

36.05784452275140
33.52066820097857
7.65291355058843
4.66936550985620
4.52611908453606

Le differenze con i dati nazionali CAM08 sono le seguenti

-1.33015547724860
0.34666820097857
-0.64408644941157
-0.95463449014380
0.15511908453606

A me non sembra siano delle differenze così bruttine, tenendo conto della generalità voluta del modello.
 
Top
M(a)rco
view post Posted on 20/4/2009, 20:27




Come detto ad Az in altra sede, il modello è ancora in fase sperimentale e da affinare. L'idea di fondo però non mi sembra per nulla malvagia.

Voi avreste mai detto che non importa quale partito vinca o perda, ma ciò che conta sono solo i rapporti di forza relativi entro una provincia?

Io no, eppure il modello appare piuttosto promettente.

Per chi si domanda "che diamine me ne faccio di tutto ciò", rispondo:

invece di avere persone presenti nei seggi, basta controllare sul sito del ministero i dati provenienti dalle province selezionate. Applichiamo a queste i pesi che abbiamo calcolato ed abbiamo entro margini di errore le proiezioni su scala nazionale dell'ordine finale dei partiti con relative percentuali.
 
Top
laurentius
view post Posted on 20/4/2009, 22:55




Sì, interessante, ma c'è il problema Lega (forza territoriale) e soprattutto i tempi di scrutinio immagino saranno come al solito biblici, quindi prima di avere dati significativi i risultati rischiano di essere già ben acquisiti.

P.S. perché non provare a trovare le province con la correlazione più alta col dato politico effettivo?
 
Top
M(a)rco
view post Posted on 21/4/2009, 00:47




CITAZIONE (laurentius @ 20/4/2009, 23:55)
Sì, interessante, ma c'è il problema Lega (forza territoriale) e soprattutto i tempi di scrutinio immagino saranno come al solito biblici, quindi prima di avere dati significativi i risultati rischiano di essere già ben acquisiti.

P.S. perché non provare a trovare le province con la correlazione più alta col dato politico effettivo?

Vedo cosa riesco a fare.
 
Top
M(a)rco
view post Posted on 21/4/2009, 01:51




CITAZIONE (M(a)rco @ 21/4/2009, 01:47)
Vedo cosa riesco a fare.

In allegato potete trovare il file .xls

Io sto trattando CAM08

Se qualcuno ha voglia, può fare CAM06 ed EUR04.

E' tutto già intestato, dovete solo inserire le PERCENTUALI con virgola escluso il Piemonte che è già stato inserito per tutte e 3 le tornate per darvi un'idea.

Trattiamo solo i 6 partiti indicati nell'intestazione per ogni tornata: dove non compare la Lega, un bello zero.

Lo so che mi odierete, ma chiedo ancora un piccolo sforzo. Grazie.

Download attachment
EURCAM.xls ( Number of downloads: 14 )

 
Top
sborgus
view post Posted on 21/4/2009, 02:54




CITAZIONE (M(a)rco @ 21/4/2009, 02:51)
CITAZIONE (M(a)rco @ 21/4/2009, 01:47)
Vedo cosa riesco a fare.

In allegato potete trovare il file .xls

Io sto trattando CAM08

Se qualcuno ha voglia, può fare CAM06 ed EUR04.

E' tutto già intestato, dovete solo inserire le PERCENTUALI con virgola escluso il Piemonte che è già stato inserito per tutte e 3 le tornate per darvi un'idea.

Trattiamo solo i 6 partiti indicati nell'intestazione per ogni tornata: dove non compare la Lega, un bello zero.

Lo so che mi odierete, ma chiedo ancora un piccolo sforzo. Grazie.

Per POL06 lo faccio io.
 
Top
M(a)rco
view post Posted on 21/4/2009, 03:16




Dite anche di contare un settimo partito?
Secondo me 6 son già sufficienti.

Ditemi voi.

p.s.: grazie Salvo
 
Top
29 replies since 16/4/2009, 08:07   484 views
  Share