Ho avuto alcune idee per rendere il modello più calibrato. Vediamo se riesco a spiegarmi decentemente.
Questo è un esempio per la provincia di Torino. Ho accorpato FI e AN in PDL, Ulivo con PD e RC metà SA. Inizio con questa provincia altrimenti vi confondo solo le idee.
Nella colonna di sinistra, per ogni partito, il segno di ogni dispersione. Se negativo, si sottostima il partito, se positivo si sovrastima rispetto al dato nazionale. In questo modo si capisce qualitativamente se la provincia è stabile nel trend di stima nel corso delle 3 elezioni.
Nella colonna di destra, per ogni partito, il trend di stima cumulativo. Se > 0 si sovrastima, se <0 si sottostima. Se le barre tendono a salire, il trend di sovrastima è crescente, altrimenti è decrescente oppure oscilla. Per ogni partito poi la percentuale di sottostima per ogni elezione nella macroregione a cui appartiene la provincia (Sino a Rimini considero Nord, in quanto le percentuali della Lega sono ancora in linea con il dato nazionale)
Perchè sto facendo ciò? Perchè inizialmente ho guardato al valor medio della dispersione per elezione e poi su tutte e 3 elezioni. Tuttavia mi sono reso conto di alcuni dettagli non trascurabili:
cosa intendiamo per stabilità di una provincia?
1. la provincia rispecchia i dati nazionali (caso più unico che raro, vale al limite per un singolo partito, ma certamente non per tutti. La lega rompe spesso i coglioni in questo)
2. Benchè non rappresentativa, la provincia può essere stabile se sovrastima o sottostima allo stesso modo (qui su tutti i partiti, visto che non ci possiamo permettere di monitorare 10 province a seconda del singolo partito). Si ricava perciò un trend medio, pesato rispetto al partito in questione.
I pesi, per le 3 elezioni (EUR04, CAM06, CAM08) sono i seguenti
Fi-AN-PDL = 0.4032 0.4267 0.4346
Ulivo-PD = 0.3865 0.3700 0.3856
Lega = 0.0618 0.0542 0.0964
UDC = 0.0732 0.0800 0.0654
RC-SA = 0.0753 0.0691 0.0179
3. Il trend di stima può essere crescente o decrescente: alcune province tendono a mostrare un andamento di sottostima o sovrastima in salita o discesa (questo è ciò che chiamo stima dinamica)
Es.: nel caso di Torino
PDL: sottostima con trend in crescita (valor assoluto)
PD: sovrastima in crescita
Lega: debolmente oscillante
UDC: sottostima in crescita (valor assoluto)
RC = sovrastima in crescita
4. Alcune invece tendono a mostrare oscillazione, e poichè abbiamo una serie storica di sole 3 elezioni è difficile stabilire cosa faranno in EUR09. Tendo perciò a scartare le province con oscillazioni troppo marcate e mi limito a quello omodirezionali.
Cosa se ne deduce da tutto ciò per il modello di proiezione?
Inizialmente ho considerato Imperia come provincia con il miglior valor medio di dispersione su tutte e 3 le elezioni entro un margine dell'1% di confidenza. Tuttavia, e qui sta il punto, non è detto che questo renda la provincia più stabile. Infatti, basta avere in un'elezione una sottostima di -10, in un'altra elezione una sovrastima di +10 e nella terza sostanziale azzeramento che il valor medio risulta 0. Le oscillazione sono una brutta gatta da pelare con solo 3 dati da cui estrapolare un quarto.
A parer mio questo non è molto indicativo, o meglio, non mi assicura al 100%.
E' forse preferibile una provincia che sovrastimi o sottostimi, anche di +30, ma che lo faccia in modo costante, oppure che lo faccia con un trend costante di crescita o decrescita.
Es.: Torino sottostima in modo costante il PDL e sovrastima in modo costante il PD. Questo è un buon segno di stabilità generale. La lega è più o meno stabile e questo mi rincuora. Al Nord, per ovvi motivi c'è un 75% circa che la lega sia sottostimata. Non mi aspettavo però che ci fosse un 85% di probabilità di sottostima in CAM08 per il PDL (probabilità in fortissima crescita per di più). Può essere anche una sottostima lieve, ma in tanto c'è.
Notare che al Nord, PD e SA in CAM08 hanno la STESSA probabilità al millesimo di essere sovrastimate. Ma mentre per la SA il trend è oscillante, per il PD è in aumento. Brutto segno.
Perciò voglio rivedere i miei conti per stabilire se con questo metodo si riesce ad ottenere una proiezione più corretta.
Certo di conti ce ne sono uno strafottio e 1/2 da fare (aritmetici e statistici), ma se il tempo è dalla mia parte penso che ne valga la pena, specie per un modello futuro di proiezione del TP su scala provinciale. Non pensavo ci sarebbe voluto tutto questo tempo però.