Web de la Generalitat de Catalunya Mapa web Contacte Castellano English
L'AIAQS 
Productes i serveis 
Projectes en curs 
Recerca 
Publicacions 
Enllaços d'interès 
Organismes de Sanitat
Inici 
Grandària mostral: entre l'error, la variabilitat i l'efecte

Silvia López, Cristian Tebé
Publicat a l'Informatiu AATRM, número 43, juny de 2008

En tot procés de planificació d'un estudi sempre arriba el moment en que l'equip investigador ha de decidir quants individus vol estudiar i es pregunta quina és la quantitat més adequada. Sempre buscant una grandària mostral que proporcioni la màxima informació al mínim cost.

El càlcul de la grandària mostral ve determinat pels objectius, les hipòtesis i la fiabilitat buscada per l'estudi. Habitualment es planteja un contrast d'hipòtesi de forma clàssica en base a l'objectiu principal, amb una hipòtesis nul•la (H0) i una hipòtesis alternativa (H1). La base del càlcul és una fórmula que podem expressar de forma general en funció de tres factors: l'error o precisió, la variabilitat i l'efecte (1) .

 Figura 1. Representació gràfica de la corba de la grandària mostral

L'error o precisió vindrà determinat per l'investigador, i respondrà al nivell de significació i a la potència del contrast. El nivell de significació (α) fixa la probabilitat de l'error tipus I, aquell que indica la probabilitat de rebutjar erròniament la H0. Per un α del 5% assumim que en cas de repetir 20 vegades el mateix estudi, en una ocasió (o en 5 de cada 100) ens equivocaríem quan rebutgéssim la H0; igualment per un α de 0,1 en 2 de cada 20 (o en 10 de cada 100). La potència (1- β) és el complementari de l'error tipus II (β) o de la probabilitat d'equivocar-nos en no rebutjar la H0. Per una β del 20% assumim que en cas de repetir 20 vegades l'estudi en 4 ocasions (o en 20 de cada 100) ens equivocaríem quan no rebutgéssim la H0.

Arribats a aquest punt i abans de parlar dels altres dos factors, l'efecte i la variabilitat, plantegem un exemple. Suposem que volem estudiar l'impacte d'un nou tractament antihipertensiu sobre la pressió arterial sistòlica (PAS) en un grup de pacients hipertensos i decidim comparar el seu efecte amb l'efecte del tractament habitual. Prenem la PAS dels pacients abans i un mes després de l'inici del tractament i en mesurem la diferència. De la literatura sabem que una diferència de més de 5 mmHg es pot considerar clínicament rellevant i que la desviació estàndard de la diferència és de 10 mmHg. Fixem l'error de tipus I al 5% i el de tipus II al 20%.

H0: Ambdós tractaments redueixen per igual la PAS.
H1: Un tractament redueix més la PAS.

Fixem-nos que l'expressió “redueix més” ens parla de l'efecte. És fàcil d'entendre que clínicament no ens valdrà qualsevol reducció de la PAS i que determinats resultats, posem per cas una reducció de 1,6 mmHg, estaran mancats de tota utilitat pràctica per molt estadísticament significatius que siguin. Així doncs ens caldrà fixar a priori quina és aquesta diferència o efecte mínim a partir del qual el resultat comença a tenir un interès pràctic, i en el nostre exemple la literatura ens ha marcat aquest mínim en 5 mmHg.

Així doncs amb la informació disponible, i aplicant les formules publicades en multitud de llibres1 o utilitzant programes (2) , (3) desenvolupats per tal efecte, la grandària mostral necessària per dur a terme aquest estudi serà de 64 pacients per grup (Figura 1). Un cop hem trobat el nombre màgic cal que ens preguntem si aquest és únic, i sobretot quines són les conseqüències d'un càlcul erroni o de no assolir-lo?

Figura 1. Representació gràfica de la corba de la grandària mostral calculada per detectar una diferència igual o superior a 5 unitats (assumint que la desviació estàndard comú és de 10), acceptant un risc alfa del 5% en un contrast bilateral en funció de la potència

Figura 1. Representació gràfica de la corba de la grandària mostral

Figura 2. Representació gràfica de les tres corbes de la grandària mostral calculada per detectar una diferència igual o superior a 5 unitats, acceptant un risc alfa del 5% en un contrast bilateral i en funció de la potència i tres valors diferents per la desviació estàndard comuna 8,10 i 12

Figura 2. Representació gràfica de les tres corbes de la grandària mostral

D'entrada ja hem vist que únic no ho pot ser perquè el seu càlcul depèn de múltiples factors que vindran determinats per nosaltres sempre basant-nos en els objectius, les hipòtesis i la fiabilitat buscada per l'estudi. Mantenint l'efecte però disminuint l'α, necessitarem una mida mostral superior. Ara bé, si pel contrari augmentem l'α requerirem d'una mida mostral inferior. En canvi, si volem un augment de la potència (1- β) això implicarà la necessitat d'una mostra de mida superior. I en relació als efectes, per detectar-ne de petits necessitarem mides mostrals més grans, i per detectar-ne de grans la mida mostral necessària serà més petita. Per tant qualsevol diferència pot ésser estadísticament significativa si disposem del nombre suficient de participants, això no voldrà dir però que esdevingui clínicament rellevant.

Per veure quines són les conseqüències d'un càlcul erroni, cal primer que abordem el factor de la variabilitat. La variabilitat ens dona una idea de la dispersió global i ens permet calibrar les diferències. Aquesta haurà de ser calculada a priori, basant-nos en estudis anteriors i amb un acurat anàlisi de la sensibilitat de les desviacions sobre aquest paràmetre. Tornant al nostre exemple, si haguéssim infraestimat la desviació estàndard de la diferència i aquesta resultés ser finalment més gran, posem que valgués 12, què passaria? D'entrada recalculant la potència ens trobaríem que amb 64 pacients per grup tindríem una potència del 65%. És a dir que la probabilitat de caure en un error de tipus II s'hauria incrementat del 20% al 35% (Figura 2), augmentant la probabilitat de no poder rebutjar la hipòtesis nul·la tot i que aquesta fos falsa. Tot plegat ens pot dur a una situació força penosa on és possible que no puguem concloure res amb prou fermesa, i per tant haguem malbaratat temps i recursos. Val a dir però que no és la fi del món (4) , especialment si el nostre estudi no presenta altres mancances metodològiques.

Els estudis amb baixa potència s'haurien de poder publicar independentment dels seus resultats (tot i que no sempre resulta fàcil) sempre que es presentessin els estimadors amb intervals de confiança (la seva amplitud ens permetran veure les mancances mostrals) i s'inclogués una discussió sobre la manca de potència dels resultats. Aquesta mena d'estudis després sempre podran ser inclosos dins una metanàlisi ajudant així a reduir el temut biaix de publicació. Val a dir que ens passaria quelcom semblant, independentment de si estiméssim correctament o no la desviació estàndard de la diferència, si no fóssim capaços d'assolir la grandària mostral calculada a priori per manca de reclutament o abandonament dels pacients. En el cas que haguéssim sobreestimat la desviació estàndard de la diferència i aquesta valgués 8, què passaria? Doncs tornaríem a calcular la potència del contrast i veuríem que amb 64 pacients tindríem una potència del 94%. I al contrari que abans, la probabilitat de caure en un error de tipus II s'hauria reduït d'un 20% a un 6% (Figura 2). I tot i que això ens pot semblar una gran notícia, en realitat es podria convertir en un malson si no estem al cas. Principalment perquè el nostre contrast d'hipòtesi esdevindria sensible a diferències clínicament irrellevants i per tant ens podríem trobar amb p valors que serien mers miratges de resultats estadísticament significatius però clínicament irrellevants.

Més enllà de trobar-nos amb el dilema ètic d'haver exposat innecessàriament a un grup de pacients a riscos potencials, recordem que l'experimentació mai és absenta de tot risc.

Altrament no cal oblidar que alhora de determinar la grandària mostral també s'ha de tenir en compte tant el tipus de disseny de l'estudi (transversal, longitudinal, etc) com el tipus de mostreig (aleatori simple, estratificat, per conglomerats, etc) que es farà servir. Doncs condicionen tant l'anàlisi, i de retruc el contrast que es realitzarà, com el càlcul de l'error estàndard de l'estimació. A més de plantejar-se alternatives més creatives que s'escapen de l'abast d'aquest article com ara són els mètodes seqüencials (5) .

Bibliografia

  1. Machin D, Campbell MJ, Fayers PM, Pinol A. Sample size tables for clinical studies. 2nd ed. Oxford (United King¬dom): Blackwell Scientific Publications; 1997.
  2. Granmo 5.2 WIN [software] (Marrugat J, Vila J, Pavesi M, Sanz F. Estimación del Tamaño de la muestra en la investigación clínica y epidemiológica. Med Clin (Barc). 1998;111:267-276). Disponible a: http://www.imim.es/media/upload/arxius/grmw52.zip
  3. PS 2.1.31 [software] (Dupont WD, Plummer WD. PS power and sample size program available for free on the Internet. Controlled Clin Trials.1997;18:274).Disponible a: http://medipe.psu.ac.th/episoft/pssamplesize
  4. Schulz K, Grimes D. Sample size calculations in randomised trials: mandatory and mystical. Lancet. 2005; 365:1348-53.
  5. Howe HL. Increasing efficiency in evaluation research: The use of sequential analysis. Am J Public Health. 1982;72(7):690-7.


< index

Data d'actualització: 17/07/2008 13:27:13 © 2010 Agència d'Informació, Avaluació i Qualitat en Salut
Avís legal  |  Sobre el web