Vârsta ca variabilă în sondaje, pregătirea și prelucrarea, analiza și prezentarea datelor

În realitate nu este așa, de fapt.
SE LEC

Se spune de obicei că variabila poate fi considerată continuă dacă poate lua orice valoare într-un anumit interval. Desigur, toate acestea - teoria pură, deoarece, în practică, rezultatul este întotdeauna exprimată printr-un număr rațional. Dar precizia este determinată de instrument de măsură.







Din câte știu, se presupune întotdeauna că vârsta este o variabilă continuă. Dar puțini dintre noi chiar și ceasul nașterii lui nu știe să vorbim de minute și secunde. Să sperăm că cel puțin în ziua indicată cu precizie. În sondajele întrebând: „Specificați vârsta ta.“ Și apoi, după cum spun ei, „Opțiuni posibile“. De obicei, se presupune numărul de ani complet trăit. În unele chestionare, este uneori chiar specificat în mod explicit. Dar, din moment ce nimeni în sondaj, în special atunci când electronic, documentele nu au nevoie, aici există oportunități mari pentru „inexactități“.

Să nu vorbim despre înșelăciune conștientă - nu avem oportunități de a verifica datele introduse pe site-ul (poate încă?). Și, din motive pur psihologice inconștiente suficient. De exemplu, persoanele în vârstă și persoanele în vârstă ar putea „Cosi“ Declarația anului. Să nu vorbim despre femei: în mod tradițional, pentru ei pentru a ascunde vârsta ta - doar aceeași voinici. Aici este un apel reflex și sondaj „Un pic mai puțin“ - în duș, ea încă hoo cât de tineri!

Tinerii sunt susceptibile de a fi rotunjite în sus. nu este specificat timp exact cum să calculeze vârsta, eu destul de sincer pot accepta că am cerut să rotundă. Deci, eu spun că am 16 (fără nici o micime în 7-8 luni ...).

De obicei, intervalul de varsta 50-60 de ani acoperă anii de 10-15 la 65-70 de la. Mb există, de asemenea, mai matur, dar ei doar au dat în poziția "Peste 70". şi apoi „Peste 60“: totul depinde de profilurile de origine - în măsura în care este aproape de faptul că „De mai sus.“

Problema este că „De fapt“, așa cum este revendicat de către medici, psihologi și sociologi, fiecare dintre noi trece prin viață, mișcare pas cu pas. Ie în viață există o perioadă relativ lungă de stabilitate noi, ca indivizi, și sunt relativ scurte „Tranziție“ - o criză de identitate:

Aici este o descriere a crizei:

    Criza de 17 ani (interval de 15 până la 17 ani). Aceasta are loc exact la începutul școlii familiare și noi la maturitate. Acesta poate fi deplasat timp de 15 ani. În acest moment copilul este pe punctul unei vieți de adult reală.

Ei bine, asta îmi dă această „Definiția“? De exemplu, un tip în 16 ani pre- sau post-criză? Și fata? Și, în general, modul în care grupurile de vârstă pot fi aceleași pentru bărbați și femei? Ei chiar de pensionare la vârste diferite set ...

Full neconstructivă pentru mine ca un analist de date. Pentru mine este necesar să se cunoască în ce etapă a vieții ar trebui să includă un anumit respondent. Vă reamintesc că statisticile de lucru cu grupuri omogene, pentru care numai aceasta este posibil să vorbim despre performanță „mediu“. Și apoi eu spun doar „Crizele vin!“ Da, este și eu știu pentru mine. Verree informații valoroase ..., dar asta e ceea ce fac eu cu ea este neclar.

Desigur, criza se leagă la vârsta de făcut doar pe baza modificărilor care au loc cu omul. Și ei sunt diferite pentru fiecare persoană. Prin urmare, este necesar de a alege momentul „fizică“ ca bază pentru segmentul de vârstă.






Deci, analist disperat ia o măciucă zecimală și împarte vârstele „Cinci“ sau „Zece“. arătând imediat incoerență și schimbarea ca durata intervalelor și limitele ei înșiși. Acestea sunt, de exemplu, intervalele de parametri "Age" Vocea online de Runet:

  1. la 18
  2. 18 la 25
  3. 26 - 30
  4. 31-35
  5. 36-40
  6. 41-45
  7. 46-55
  8. peste 55 de ani

Se pare: pentru a face un grup rezonabil de respondenți, este necesar să se analizeze toate performanțele lor - și așa-numitul „factori controlabili“, și variabilele reale. Dar cum putem construi aceste grupuri? Firește, maxim, astfel încât acestea diferă una de alta (recunoașterea de model de grupare și altele asemenea). Apoi, semnificația diferențelor în ceea ce privește care suntem dornici de a face posibilă, doar vorbește despre cât de bine această subdiviziune statistică.

Dar statisticile atașate la proba! Iar descoperirile noastre, atât de rezonabile la prima vedere, ar putea fi artefacte ... Ce reprezentativitate a eșantionului cu un sondaj on-line poate fi spus? Care este ansamblul statistic sunt acești oameni? Este clar că acestea au acces la Internet, timpul pentru el să urce, și dorința de a răspunde la întrebări. Și nu există nici o certitudine că parametrii srednesetevogo respondent într-un fel legat, de exemplu, cu un candidat pentru poziția medie. De exemplu, femeile din sondajul „cariera ancorează“ de trei ori mai mult decât bărbații!

Cu toate acestea, mai departe, cu atât mai puțin va fi această diferență, dar ceea ce este în dinamica - Dumnezeu știe, dacă el este interesat. grupe de vârstă mai mari, există puține obișnuit la internet, în mod natural, devin treptat pe cale de disparitie. Și, MB vreodată sondaj on-line va fi de valabilitate echivalentă interviului în personalul.

Să ne întoarcem la grupul selectat. Puteți încerca să limiteze "Factori" - sex, vârstă, educație, etc. parametrii care nu au legătură cu subiectul anchetei. Este mult mai inteligent metodologic - vom construi primul grup, și apoi modul în care acestea diferă în ceea ce privește ancheta subiect (test, etc).

Dar oamenii, „același“ o t.zr. poate fi radical diferită de cealaltă. Numai cercetătorul poate declara anumite persoane „aceleași“ pentru propriile lor scopuri. De aceea, pentru el

S-ar părea că ceva comun pentru oameni încă acolo - ei sunt oameni. Deci, ce? Care setați parametrii pentru toți oamenii la fel? Greutate, înălțime, vârstă? Deci, este „fizic“ parametri. Cu toții avem o conștiință și nevoi? Și ce?

Este evident că, în sondajul, în special - electronice, nu există oportunități interviuri „profunzime“ în cazul în care cercetătorul poate clarifica și chiar pentru a corecta inadvertențele din factorii solicitate. Să nu vorbim despre „Funny People“ - și fără ele, există multe probleme: aceeași înțelegere a problemelor, dorința subconștientă de a ghici răspuns „dorit“ ...

Toate acestea se bazează pe umerii unui analist și numit „Curățarea datelor“. Ar trebui să detecteze posibil „discordanțele“ în datele și propun metode de tratament. Cel mai adesea, acest lucru va fi o simpla excludere a unor astfel de respondenți din eșantion. Respondenții și la fel de mult ca un sondaj de individ imposibil. Deci, personal, am - pentru cele mai severe criterii de selecție a datelor.

În mod evident, selectarea grupurilor de persoane cu parametri similari se realizează doar pe baza datelor statistice, ca cele mai frecvente. Ie Există doar două moduri de integrare, atunci când intervalele derivate sunt selectate numai pe baza de:

  • reducerea numărului de benzi (abordare absolută);
  • din grupele rezultate (abordare statistică).

Notă Principalul dezavantaj al a doua abordare. In timp ce nu există nici un set de „convenționale“ de intervale, fiecare dintre ele este legat de o anumită probă. Și pe această bază, o astfel de extindere poate fi pusă la îndoială ca fiind „nepotrivite“ la celelalte probe.

Baza este, desigur, abordarea „fizică“, de îndată ce poate servi ca bază pentru concluzii cu privire la variabilitatea caracteristicilor oricărei persoane în timp. Dar, din moment ce vorbim că, direct sau indirect, cu privire la o persoană, va trebui să țină seama de caracteristicile sale ca un obiect de cercetare. Acest lucru ridică două probleme:

  • La ce vârstă ar trebui să „înceapă“ intervale de intrare;
  • ceea ce este db lungimea lor - la fel sau nu, și ce fel.

Totul nu este la fel de ușor cum pare la prima vedere. Evident, diferența în rata de dezvoltare umană - atât corpul și personalitatea - cu trecerea timpului. Ea, această rată este foarte ridicată în prima perioadă de după naștere și aproape de zero (ca să nu spun - negativ) la sfârșitul vieții. Din moment ce suntem interesați este „distanța parcursă“, a, și că este ceea ce aspirăm să fie împărțită în orice zone calitativ diferite, lungimea intervalelor ar trebui să crească în mod evident.

Este clar că „extinsă“ intervalele de vârstă au. Dar ceea ce dă, dă naștere la probleme - o temă specială. Și este necesar să se discute cu numere în mâinile lor. Asta e ceea ce am făcut în acest articol.