Editor, Editors, USER, admin, Bureaucrats, Check users, dev, editor, founder, Interface administrators, oversight, Suppressors, Administrators, translator
10,784
edits
Line 49: | Line 49: | ||
====La partizione della rilevanza causale==== | ==== La partizione della rilevanza causale ==== | ||
Essendo <math>n</math> il numero di persone su cui dobbiamo condurre le analisi, se dividiamo questo gruppo, in base a determinate condizioni come spiegato di seguito, in <math>k</math> sottoinsiemi <math>C_i</math> con <math>i=1,2,\dots,k</math>, viene creato un cluster chiamato "set di partizioni" <math>\pi</math>. | |||
<math>\pi = {C_1, C_2,\dots,C_k } \qquad \qquad \text{con} \qquad \qquad C_i \subset n ,</math> | |||
dove il simbolismo <math>C_i \subset n</math> indica che la sottoclasse <math>C_i</math> è contenuta nel numero <math>n</math>. | |||
Per poter definire la partizione <math>\pi</math> come partizione di rilevanza causale, deve possedere queste proprietà: <blockquote>Per ogni sottoclasse <math>C_i</math>, la condizione deve essere che <math>rc=P(D \mid C_i)- P(D) \neq 0,</math> ovvero la probabilità di trovare nel sottogruppo <math>C_i</math> una persona che presenti i sintomi, i segni clinici e gli elementi appartenenti all'insieme <math>D={\delta_1,\delta_2,...,\delta_n}</math>. Una partizione causalmente rilevante di questo tipo viene definita '''omogenea'''. | |||
Ogni sottoinsieme <math>C_i</math> deve essere 'elementare', cioè non deve essere ulteriormente suddiviso in altri sottoinsiemi, poiché, in tal caso, non avrebbero rilevanza causale.</blockquote> Assumiamo ora, ad esempio, che il campione di popolazione <math>n</math>, a cui appartiene la nostra paziente Mary Poppins, sia una categoria di soggetti dai 20 ai 70 anni. Supponiamo inoltre che in questa popolazione ci siano individui che presentano gli elementi appartenenti al set di dati <math>D={\delta_1,.....,\delta_n}</math>, corrispondenti alle prove di laboratorio menzionate e descritte in '[[La logica del linguaggio classico]]'. | |||
Supponiamo che in un campione di 10.000 soggetti dai 20 ai 70 anni abbiamo un'incidenza di 30 soggetti <math>p(D)=0.003</math> che presentano i segni clinici <math>\delta_1</math> e <math>\delta_4</math>. Abbiamo scelto di utilizzare questi dati per dimostrare il processo probabilistico perché in letteratura i dati relativi ai segni e sintomi clinici per i disturbi temporo-mandibolari variano ampiamente e presentano un'incidenza che riteniamo eccessivamente alta. | |||
Supponiamo che in un campione di 10.000 soggetti | |||
</math>. Abbiamo | |||
<ref name=":2">{{Cite book | <ref name=":2">{{Cite book |
edits