Көбірек

Имитациялық конверттер және маңыздылық деңгейлері

Имитациялық конверттер және маңыздылық деңгейлері


Көптеген кеңістіктік талдау пакеттері Монте-Карлода жоғары және төменгі «конверттерді» қашықтықтың функциясы ретінде жиынтық статистиканы имитациялауға мүмкіндік береді (мысалы, K-функциясы, жақын көрші және т. Б.). Мен кейде конверттен ауытқудың маңыздылығын көрдім:

p = m * 1 / (n +1)

Қайда n бұл модельдеу саны және м бұл әр қашықтық үшін модельдеу үлгісінен ең үлкен және ең кіші бақылаулардың дәрежесі р. Мысалы, егер м = 1, модельдеу үлгісінен бірінші үлкен және бірінші кіші мәндер жоғарғы және төменгі модельдеу конверттерін салу үшін қолданылады. Егер м = 2, екінші үлкен және екінші кіші мәндер модельдеу конверттерін салу үшін қолданылады.

Менің сұрақтарым:

1 / қайда + 1 бөлгіште қайдан шыққан? Мысалы, егер біз 39 модельдеу жүргізсек, неге 40-қа бөлу керек?

2 / Жүргізілген модельдеу санына қарамастан (яғни 39 немесе 9999), м маңыздылықты есептеуге пропорционалды емес әсер еткен сияқты. 9999 имитациялардан модельдеу үлгісінің 2-ші ең төменгі және ең төменгі мәндерін алу симуляция конверінің еніне 39 симуляциялардан гөрі аз әсер ететін сияқты. Бұған сенімді теориялық негіз бар екеніне сенімдімін, бірақ оның логикасы мені тастап кетеді. Мұны интуитивті етуге көмектесетін инерциалды (кеңістіктік емес) статистиканың ұқсастығы бар ма?

3 / Имитациялық конверттің нәтижелерін қалай ұсыну керек? Мен кейде көремін б модельдеу үшін анықталған мән, бірақ ұсынылғанын қалай білуге ​​болады б арналған м= 1 немесе одан да қатаң м=3?

Өңдеу: Әрбір вубердің түсініктемесі кейбір түсініктемелер:

1 / Имитациялық тип толық кеңістіктік кездейсоқтық (CSR) сияқты нөлдік гипотезаны тексеруге жатады.

2 / Имитациялық конверттерді есептейтін пакеттің мысалы - спатстат (R). Функция деп аталады конверт және ішті параметр болып табылады м жоғарыдағы теңдеуде сипатталған.


  1. +1 - бұл конвенция. Мұның бәрі қатарларды процентильдерге ауыстыру туралы. 99 қайталануды қарастырыңыз. Дәреже 1-ден 99-ға дейін болады (барлық қадамдармен). 99-ға бөліп, 100-ге көбейту арқылы дәрежені процентильге ауыстыруға болады. Бұл 100/99 = 1,01% -дан 99 * 100/99 = 100% -ке дейін процентулалар шығарады. Бұған қажетті симметрия жетіспейді: сіз оны айтып отырсыз ең төменгі мәні төменгі жағынан 1,01%, бірақ ең жоғары мән - бұл диапазонның жоғарғы жағында орналасқан. Бұл симметрияны қалпына келтіру үшін қатарларды 0,5-ке төмендету керек: ең төменгі мәнге (1-0,5) * 100/99 = 0,50% процентуласы беріледі, ал ең жоғарғы мәнге (99-0,5) * 100 / тең процентиль беріледі. 99 = 99,50% = 100 - 0,50%. Барлығы жақсы және симметриялы болады. Бөлгішке 1 қосу арқылы қатарларды түзетуден аулақ бола аласыз. Енді мысалдағы процентильдер 1 * 100/100 = 1% -дан 99% -ке дейін, жұп, симметриялы, 1% қадамдарда. (Мен мұны суреттеймін және оны жалпы түрде http://www.quantdec.com/envstats/notes/class_02/characterizing_distributions.htm мекен-жайы бойынша талқылаймын: сол беттің төменгі жағына қараңыз.)

  2. Модельдеудің мақсаты тек кездейсоқ болатын жағдайларды есептеу («нөлдік үлестіру»). Мысалы, Джен Патерноның Пенн Стэйдегі 37 жеңістегі 24 жеңісі бойынша футбол добы рекорды соқыр сәттіліктің нәтижесі ме, жоқ па, соны сұраймыз, егер әр ойын әділ флиппен шешілген болса, жақсы емес (немесе нашар). Ол үшін біз монетаны 37 рет айналдырып, бастарын санап (жеңістерді білдіру үшін) және мұны барлығы 99 қайталау үшін қайталай аламыз. Біз бұл 99 әрекеттің өте азы 24 немесе одан да көп басқа қол жеткізгенін байқадық, мүмкін 5 немесе одан да азы. Бұл уақыт өте келе оның командалары тостаған жарыстарынан гөрі жақсырақ болғандығының жақсы дәлелі, бұл олардың төмен бағаланғанын көрсетті. (99 бұл жерде қолдану үшін өте аз сан, шын мәнінде: мен 100000 қолдандым, мен 2472 немесе одан көп бастың 4972 жағдайын байқадым.)

    Бұл мысалдың сіз бақылайтын бір аспектісі - бұл дәлелдемелердің салмағы: 5/100 мүмкіндік сізге нәтиже кездейсоқтыққа (немесе сәттілікке) байланысты емес деп сендіру үшін жеткілікті ме? Мән-жайға байланысты кейбір адамдарға күшті дәлелдер қажет, ал басқалары әлсіз. Бұл рөл м. Сіз конверттерді (мысалы) 99 қайталанудың ең шетінде сызған кезде, сіз ең төменгі 1% және ең жоғары 1% деп есептейсіз. Сіз кездейсоқ ауытқулар осы конверттер арасындағы қисықты 100 - 1 - 1 = 98% уақыт аралығында орналастырады деп ойлайсыз. Бұл сәйкес келеді (шамамен шамамен 99 қайталау әлі де тым аз) «екі жақты р-мәні 0,02-ге» дейін. Егер сізге осындай дәлелдемелер қажет болмаса, сіз таңдай аласыз (айтыңыз) м = 3. Енді төменгі конверт мүмкіндік үлестірімінің 3/99 = 3,03% төменгі бөлігін, ал жоғарғы конверт сол үлестірімнің жоғарғы 3,03% -ын білдіреді. Сіздің екі жақты p мәні шамамен 6% құрайды. (99 өте аз болғандықтан, нақты p мәні 15% немесе одан да көп болуы мүмкін, сондықтан сақ болыңыз! Мүмкіндігінше Монте-Карлоның көптеген қайталауларын жасаңыз.)

  3. Белгілі бір мағынада Сіз суретті бейнелеуге тырысасыз конверттерді (қисықтарды) тарату. Бұл күрделі нәрсе. Бір жолы - алдын ала пайыздық мөлшерлемелерді таңдау, мысалы 1% (және, демек, симметрия бойынша, 99%), 5% (және 95%), 10% (және 90%), 25% (және 75%). 99 имитацияланған қисықтардың ішінен олар шамамен ең төменгі (және ең жоғары), бесінші ең төменгі (және бесінші ең жоғары) және т.с.с. сәйкес келеді (бір-бірін осылай қиып алатын қисықтарды салыстыру өте қиын, дегенмен: олар қиылысқанда, яғни екіншісінен гөрі әлдеқайда жоғары ма?) Осы таңдалған қисықтарды салу, ең болмағанда, тек кездейсоқ тетіктермен жасалатын спрэд туралы визуалды түсінік береді.

Кішкене қисық сызықтарды құру (нөлдік гипотеза бойынша) және таңдалған бірнеше суретті салу тәсілі дегенді түсінесіз деп үміттенемін зерттеушілік, шамамен, және біршама шикі, өйткені бұның бәрі. Бірақ сіздің деректеріңіз кездейсоқ пайда болуы мүмкін екенін болжаудан гөрі әлдеқайда жақсы.


Бейнені қараңыз: Бүкіләлемдік желі - ғаламтор. Шақ ұғымы. 7-сынып. Қазақ тілі