4. Demogrāfiskie dati
Tā kā kampaņas un sabiedriskās domas pētnieki arvien vairāk izmanto komerciālos vēlētāju sarakstus, ir paplašinājies vēlētāju failu piegādātāju sniegtais datu piedāvājums. Papildus standarta politiskajiem piedāvājumiem daudzi pārdevēji tagad sniedz virkni papildu demogrāfisko un dzīvesveida datu, kas iegūti, izmantojot prognozēšanas modeļus vai apkopoti no citiem avotiem. Šajā nodaļā vēlētāju datnēs esošie demogrāfiskie dati tiek salīdzināti ar ekspertu pašpārskatu.
Paredzamie modeļi izmanto datus no trešo pušu komerciālo pārdevēju un aptaujas datu kopas, lai mēģinātu paredzēt vairākas pazīmes, sākot no personas rases līdz izglītības sasniegumiem. Tomēr dažiem modelētajiem mainīgajiem liela daļa pamatinformācijas ir pieejama tikai daļai valstu. Piemēram, lai prognozētu personas rasi vai etnisko piederību, pārdevēji paļaujas uz vairāku informāciju no vēlētāju ierakstiem un papildu datiem. 16 štatos vai valstu daļās, galvenokārt dienvidos, 1965. gada Balsošanas tiesību likumā tika noteikts, ka štati uzskaita vēlētāju sacensības štatu vēlētāju sarakstā. Tomēr valstīs, kur šī informācija nav pieejama, pārdevēji mēģina izmantot informāciju no citiem avotiem, piemēram, identificējot vispārpieņemtus uzvārdus vai ja kāds dzīvo apgabalā, kurā blīvi apdzīvo konkrēta rase.
Papildus valsts vēlētāju ierakstiem un komerciālajiem datiem daži vēlētāju failu piegādātāji izmanto aptaujas datus, lai uzlabotu un izveidotu savus modeļus. Jo īpaši partizānu pārdevēji modeļos bieži ievada aptauju datus no partnerorganizācijām, lai uzlabotu to precizitāti.
Rase un etniskā piederība lietās parasti ir labi izmērīta
Ņemot vērā rases un etniskās piederības centrālo nozīmi Amerikas politikā, vēlētāju lietu pārdevēji mēģina identificēt kartotēkā esošo personu rasi. Pārdevēji var izmantot sacensības, kas ierakstītas valsts vēlētāju reģistros, vietās, kur valstīm ir jāsavāc tās. Citās vietās sacensības var modelēt, izmantojot tādu informāciju kā uzvārds vai ģeogrāfiskā koncentrācija.
Modelēto rases pārstāvju rasi un etnisko piederību salīdzināja ar to, kā eksperti to aprakstīja, kad viņi tika pieņemti darbā panelī (vai nākamajās profila aptaujās). Kopumā lielākā daļa pārdevēju spēj precīzi identificēt balto respondentu rasi, un pareizas identifikācijas rādītāji svārstās no 81% 3. failam līdz 97% 2. failam. Tomēr, ja precīzi jāidentificē pašu ziņoto melno un Hispanic panelists, daži pārdevēji ir precīzāki nekā citi.
Starp paneļa dalībniekiem, kuri aptaujas pasākumā paši apgalvo, ka ir melni, attiecīgie modeļi ir pareizi klasificējuši aptuveni trīs ceturtdaļas 2. un 5. failā (74% 5. failā un 76% 2. failā). Tomēr 1. faila modelis precīzi identificē daudz mazāk melno paneļu dalībnieku (56%).
Klasificējot Hispanic grupas dalībniekus, par kuriem ziņots par sevi, failos ir mazāka atšķirība, sākot no 64% Hispanic, kas pareizi klasificēti 3. failā, līdz 75% 1. un 5. failā.
Kopumā pareizas klasifikācijas līmenis pēc rases svārstās no 74% 3. failā līdz 85% 2. failā.
Citu demogrāfisko mainīgo precizitāte ir ļoti atšķirīga
Papildus informācijai, ko sniedz valsts vēlētāju saraksti, daudzi vēlētāju failu piegādātāji iekļauj informāciju no citiem publiskiem un komerciāliem datu avotiem. Šie dati varētu būt iegūti no dažādiem avotiem, piemēram, no žurnālu abonementiem vai kredītbirojiem, ar mērķi sniegt papildu informāciju par amerikāņiem papildus tam, kas ir pieejams tieši no štatu vēlētāju sarakstiem.
Komerciālu datu klātbūtne vēlētāju datnēs ir plaši izplatīta; tomēr konkrētie pieejamie mainīgie lielumi atšķiras no piegādātāja. Daudziem pārdevējiem ir kredītbiroju vai kredītkaršu kompāniju finanšu dati, tostarp tādas lietas kā mājas cena un hipotēkas summa. Turklāt daži pārdevēji sniedz tādu informāciju kā nodarbošanās, ienākumi un pieaugušo vai bērnu skaits mājsaimniecībā. Medību vai zvejas licenču esamība ir viens no visuresošākajiem komerciālajiem mainīgajiem lielumiem.
Šie komerciālie dati sevi parāda arī vairākos veidos. Daži no šiem mainīgajiem lielumiem ir atsevišķi kā karogi, piemēram, medību licences esamība, bet citi ir iekļauti modeļos, lai prognozētu konkrētus rezultātus vai demogrāfiskos apstākļus. Piemēram, vairāki pārdevēji piedāvā personīgo interešu modeļus, piemēram, būt ieroču īpašniekam vai laivošanas entuziastam - informāciju, kas veidota, pamatojoties uz tādiem avotiem kā žurnālu abonēšana.
Trīs biežāk pieejamo komerciālo mainīgo - izglītība, ienākumi un reliģiskā piederība - analīze parāda, ka daži modeļi ir precīzāki nekā citi. Kopumā lielākajai daļai pārdevēju bija augstāka precizitāte nekā ienākumu prognozēšanā. Runājot par reliģisko piederību, pārdevēji lielākoties pareizi prognozē lielas ASV reliģijas, piemēram, protestantismu, taču tām ir mazāk panākumu ar mazāk izplatītām reliģijām, piemēram, budismu.
Viena izplatīta problēma daudzos modeļos ir trūkstošo datu pārsvars, un lielās atbilstību daļas dažos mainīgajos ir klasificētas kā neklasificētas. Piemēram, novērtējot modeļus, kas paredzēti, lai prognozētu izglītības līmeni, vairāk nekā puse (57%) 4. failā esošo spēļu un viena ceturtdaļa (25%) 5. faila atbilstību ir uzskaitītas kā neklasificētas.
Tomēr, ja tiek izslēgti tie, kuriem trūkst izglītības novērtējuma, daudziem modeļiem ir samērā augsts pareizas grupas dalībnieku klasifikācijas īpatsvars pēc viņu pašu norādītā izglītības statusa. Pilnībā sešus no desmit vai vairāk koledžas absolventus 1., 4. un 5. failā pareizi klasificē kā absolvējušus koledžā.12
Mājsaimniecības ienākumus var būt visgrūtāk novērtēt no demogrāfiskajiem mainīgajiem lielumiem. Aptaujas ienākumu mērījumu precizitāti var ietekmēt daudzi faktori, tostarp respondenta zināšanu trūkums (respondentiem parasti tiek lūgts atsaukt kopējos mājsaimniecības ienākumus no iepriekšējā gada). Turklāt ienākumi ir jutīga tēma, un aptaujas respondenti, visticamāk, samazināsies, lai nodrošinātu savus ienākumus, nekā izmantojot citus demogrāfiskos mainīgos. Varbūt nav pārsteidzoši, ka modelētie ienākumi failos - pat ja tādi ir paredzēti - ļoti precīzi neatbilst ienākumu apsekojuma ziņojumiem. Kopumā četras lietas, kurās tika aprēķināti koriģētie ienākumi, vienā no četrām kategorijām attiecināja tikai 30% līdz 46% respondentu.
Failiem bija grūtības klasificēt gan respondentus ar augstiem, gan zemiem ienākumiem. Četri no desmit vai vairāk, kuri paši ziņo, ka ienākumi ir 100 000 USD vai vairāk, ir pareizi klasificēti 4. failā (pareizi klasificēti 41%) un 5. failā (45%). Aptuveni viena trešdaļa no pašnodarbinātajiem pieaugušajiem ar zemākajiem ienākumiem (gadā nepārsniedz 30 000 ASV dolāru) ir pareizi klasificēta katrā no četriem failiem, kas ziņoja par ienākumiem.
Reliģiskās piederības prognozēšanai izmantotie modeļi ievērojami atšķiras pēc pareizi klasificēto ekspertu skaita. Lai pārliecinātos, visi modeļi vislabāk prot precīzi prognozēt protestantus - lielāko reliģisko grupu ASV. 1., 4. un 5. failā apmēram trīs ceturtdaļas (attiecīgi 72%, 77% un 75%) pašidentificēto protestantu ir pareizi klasificēti. 2. kartotēkā pareizi klasificēti aptuveni seši no desmit (62%) protestantu. (Sākotnēji nedaudz mazāk nekā puse amerikāņu šobrīd uzskata sevi par protestantiem.)
ASV mazākajās reliģiskajās grupās daži, visticamāk, tiks pareizi modelēti nekā citi. Piemēram, lielākā daļa failu veic pareizāku hinduistu klasifikāciju, nevis budistu klasifikāciju, lai gan abas grupas ASV ir aptuveni vienādi reti.
Lietas nemēģina kategorizēt cilvēkus, kuri nav saistīti ar kādu reliģiju, taču viņu atlikusī kategorija “neklasificēts” sniedz pierādījumus tam, ka dažas personas nav reliģiski identificētas. Kopumā neklasificētā grupa failos svārstās no 5% līdz 21%. Bet šīs neklasificētās personas ne vienmēr ir reliģiski nesaistītas - tikai 28% no tiem, kuri nav klasificēti 1. failā, ir cilvēki, kuri panelī identificē kā ateistus, agnostiķus vai “it īpaši neko”, un tas palielinās līdz 36% šo 2. failā Ņemot vērā, ka gandrīz viena ceturtā daļa pieaugušo nav reliģiski saistīti, atlikusī kategorija “nekategorizēti” nedara īpaši labu darbu viņu atrašanā.
Pareizi klasificēto procentuālais daudzums, ieskaitot tos, kuru trūkst vai kuri nav klasificēti pēc attiecīgā mainīgā, nodrošina dažādu modelēto demogrāfisko datu salīdzinājumu. Daudzi faili spēja pareizi klasificēt lielu daļu ekspertu viņu reliģijā, par kuru viņi ziņoja. Tomēr vairāki faili, īpaši fails ar viszemāko atbilstības līmeni (5. fails), izcēlās ar to, ka varēja pareizi klasificēt ievērojamu respondentu izglītības un ienākumu daļu.