Wednesday, October 12, 2016

Trading Strategie Grade Van Vryheid

Die toets vereis dat die aantal reëls en / of beperkings opgelê deur die handel stelsel of metode. Die aantal reëls en / of beperkings word gebruik om die aantal grade van vryheid te bereken. wat nodig is om die t waarde vir die t-toets te bereken. Daar moet 'n voldoende aantal grade van vryheid wees om te verseker dat die stelsel is nog nie verby nie-pas of oor-new om die mark. Oor-pas of oor-optimalisering beteken dat parameters se die handel stelsel is gekies om te werk aan spesifieke markte of onder beperkte marktoestande. 'N oor-pas of oor-new handel stelsel is onwaarskynlik om goed te presteer op ander markte of wanneer marktoestande verander. Die meeste handel kenners dit eens dat oor-new stelsels moet vermy word. Die aantal grade van vryheid is die aantal ambagte minus die aantal beperkings. Met te min bedrywe, kan die winsgewendheid van die stelsel of metode wees as gevolg van 'n kans reëling van ambagte. Hoe meer ambagte, hoe groter die aantal grade van vryheid en hoe meer waarskynlik is dit dat die berekende gemiddelde wins is nie 'n statistiese gelukskoot, maar 'n reële getal wat waarskynlik hou wat in die toekoms. Om die aantal beperkings tel, Thomas Hoffman (Babcock, Bruce. Die Business One Irwin Guide to Trading Systems. Richard D. Irwin, Inc. 1989, p. 89) stel voor dat die ondersoek van reëls van 'n handel stelsel en tel 'n voorwaarde dat die sou verander lei ambagte. Byvoorbeeld, veronderstel jy 'n handel stelsel wat koop wanneer vandag se noue minder as naby gister in 'n up tendens is. Dit omskryf 'n up tendens soos wanneer 'n korter bewegende gemiddelde is groter as 'n langer bewegende gemiddelde. Vir eenvoud, neem die verkoop kant is die omgekeerde, en daar is geen stop. Dit is 'n eenvoudige stop en omgekeerde stelsel. Die bewegende gemiddelde cross-over toestand sou waarskynlik gereken word as drie beperkings: een vir die toestand self, en een vir elke bewegende gemiddelde tydperk. Die prys patroon sal 'n ander beperking vir 'n totaal van vier beperkings vir die lang kant wees. Daar sal nog vier vir die kort kant vir 'n totaal van agt beperkings wees. As daar net agt ambagte, byvoorbeeld, sou daar geen grade van vryheid, en jy moet 'n vertroue in die gemiddelde handel getal nie, selfs al is dit 'n baie hoë was. Aan die ander kant, as daar 100 ambagte, sou daar 92 grade van vryheid, wat jy baie meer vertroue in die gemiddelde handel nommer moet gee. D ie t-toets kan uitgedruk word as 'n vertrouensinterval vir die gemiddelde handel: GI = t * SD / sqrt (N) waar GI is die vertroue interval rondom die gemiddelde handel, t is die Student se t-statistiek, SD is die standaardafwyking van die ambagte, N is die aantal ambagte, en sqrt verteenwoordig & quot;. vierkantswortel & quot; Die t-statistiek is afhanklik van die aantal grade van vryheid en die vertroue vlak. Die vertroue interval beteken dat die gemiddelde handel is geneig om te lieg tussen T - GI en T + GI. Vir die stelsel om winsgewend te wees op die bepaalde vertroue vlak, die gemiddelde handel, T. moet groter as nul wees by die ondergrens, T - GI; maw Indien hierdie toestand is waar op die bepaalde vertroue vlak, beteken dit dat die stelsel of metode is inherent winsgewende onderhewig aan die aannames van die toets. Een van hierdie aannames is dat die statistiese eienskappe van die ambagte bly dieselfde. Spesifiek, as die gemiddelde handel en sy standaardafwyking dieselfde in die toekoms bly, sal die resultate bly geldig wees. Maar, soos markte verander en ontwikkel met verloop van tyd, die eienskappe van die statistiese verspreiding van ambagte kan net sowel verander, so versigtig geregverdig in die interpretasie van die resultate. Leerdoelwitte Definieer grade van vryheid Skat die variansie van 'n monster van 1 as die bevolking gemiddelde is bekende Noem waarom afwykings van die steekproefgemiddelde is nie onafhanklik Noem die algemene formule vir grade van vryheid in terme van die aantal waardes en die aantal geskatte parameters Bereken s 2 Sommige beramings is gebaseer op meer inligting as ander. Byvoorbeeld, is 'n skatting van die variansie wat gebaseer is op 'n steekproefgrootte van 100 op grond van meer inligting as 'n skatting van die variansie wat gebaseer is op 'n steekproefgrootte van 5. Die grade van vryheid (df) van 'n skatting is die aantal onafhanklike stukke van inligting oor wat die skatting is gebaseer. As 'n voorbeeld, kom ons sê dat ons weet dat die gemiddelde hoogte van martians is 6 en wil die variansie van hul hoogtes te skat. Ons lukraak monster een Mars en vind dat sy hoogte is 8. Onthou dat die variansie word gedefinieer as die gemiddelde kwadraat afwyking van die waardes van hul bevolking beteken. Ons kan die kwadraat afwyking van ons waarde van 8 uit die bevolking gemiddeld van 6 te bereken om 'n enkele kwadraat afwyking van die gemiddelde vind. Hierdie enkele kwadraat afwyking van die gemiddelde, (6/8) 2 = 4, is 'n skatting van die gemiddelde kwadraat afwyking vir alle martians. Daarom, gebaseer op die monster van een, sou ons skat dat die populasievariansie is 4. Hierdie skatting is gebaseer op 'n enkele stuk van inligting en het dus 1 DF. As ons 'n ander Mars monster en het 'n hoogte van 5, dan kan ons 'n tweede skatting van die variansie bereken, (5-6) 2 = 1. Ons kan dan gemiddeld ons twee skattings (4 en 1) om 'n skatting van 2.5 verkry . Aangesien hierdie skatting is gebaseer op twee onafhanklike stukkies inligting, dit het twee grade van vryheid. Die twee skattings is onafhanklik, want hulle is gebaseer op twee onafhanklik en lukraak gekies martians. Die ramings sal nie onafhanklik wees indien daar na monsterneming een Mars, het ons besluit om sy broer as ons tweede Mars kies. Soos u waarskynlik dink, dit is redelik skaars dat ons weet die bevolking beteken wanneer ons die skatte van die variansie. In plaas daarvan, ons moet eers skat die bevolking gemiddelde (& mu;) met die steekproefgemiddelde (M). Die proses van beraming van die gemiddelde raak ons ​​grade van vryheid soos hieronder getoon. Om terug te kom ons probleem van die skatte van die variansie in Mars se hoogtes, laat ons veronderstel dat ons nie weet die populasiegemiddelde en daarom moet ons dit skat van die monster. Ons het twee martians gemonsterde en gevind dat hul hoogtes is 8 en 5. Daarom man, ons skatting van die bevolking beteken, is M = (8 + 5) / 2 = 6,5. Ons kan nou bereken twee skattings van variansie: Skat 1 = (8-6,5) 2 = 2.25 Skat 2 = (5-6,5) 2 = 2.25 Nou vir die belangrikste vraag: Is hierdie twee skattings onafhanklik? Die antwoord is nee, want elke hoogte het bygedra tot die berekening van M. Sedert hoogte van 8 beïnvloed M die eerste Mars se, is dit ook beïnvloed Skat 2. As die eerste hoogte was, byvoorbeeld, 10, dan M sou gewees 7.5 en Skat 2 sou gewees het (5-7,5) 2 = 6,25 in plaas van 2,25. Die belangrike punt is dat die twee skattings is nie onafhanklik en daarom het ons nie twee grade van vryheid het. Nog 'n manier om te dink oor die nie-onafhanklikheid is van mening dat as jy die gemiddelde geweet en een van die tellings, sal jy die ander telling weet. Byvoorbeeld, as 'n mens telling is 5 en die gemiddelde is 6,5, kan jy bereken dat die totale van die twee tellings is 13 en dus dat die ander telling moet wees 13-5 = 8. In die algemeen is die grade van vryheid vir 'n skatting is gelyk aan die aantal waardes minus die aantal parameters beraam op pad na die skatting betrokke. In die martians byvoorbeeld, is daar twee waardes (8 en 5) en ons moes 'n parameter te skat (& mu;) op die pad na die skatte van die parameter van belang (& sigma; 2). Daarom is die skatting van variansie het 2-1 = 1 graad van vryheid. As ons 12 martians het gemonsterde, dan is ons skatting van variansie sou 11 grade van vryheid gehad. Daarom is die grade van vryheid van 'n skatting van variansie is gelyk aan N - 1, waar n die aantal waarnemings. Onthou van die afdeling oor veranderlikheid wat die formule vir die beraming van die variansie in 'n monster is: Die deler van hierdie formule is die grade van vryheid. Beantwoord asseblief die volgende vrae: Teenoor 'n eenvoudiger verhemelte My verhemelte is eenvoudiger as wat dit gebruik te word. 'N Jong Sjef voeg en voeg en dra by tot die plaat. Soos jy ouer word, begin jy om weg te neem. Jacques Pepin, beroemde Franse sjef Die huidige artikel reeks handel oor die konsep performance verval, wat ontstaan ​​wanneer die prestasie van 'n sistematiese handel strategie is wesenlik erger in aansoek as dit geblyk tydens die toets. Ons het gehandel oor die konsep van arbitrage in ons laaste post, 'n parallel met die verskynsel van veelvuldige ontdekking in wetenskap te teken. In wese, ons vermoed dat baie ontwikkelaars teken van 'n soortgelyke liggaam van navorsing sal stamp teen soortgelyke aansoeke teen ongeveer dieselfde tyd. Aangesien hierdie beleggers meeding om dieselfde of soortgelyke ongerymdhede oes, sal elke belegger 'n kleiner deel van die beskikbare alfa oes. Ons het ook gepraat oor redes waarom ons is vol vertroue dat deurdagte aktiewe batetoewysing strategieë is geneig om hul sterk risiko-aangepaste opbrengs profiel te bewaar vir die afsienbare toekoms. Onthou dat 'n verskeidenheid van strukturele struikelblokke te verhoed kontemporêre groot geld belange soos pensioene, skenkings en ander groot instellings van die ontginning van hierdie geleentheid vir arbitrage. Op wortel, is hierdie groot kapitaal poele beperk deur 'n groep-dink, korporatiewe struktuur, en stadig bewegende bestuur prosedures. Hierdie beperkings verhinder hulle uit migreer hul fokus van tradisionele bronne van Alpha (maw sekuriteit seleksie) om taktiese bronne. Hierdie pos begin ons verkenning van die konsep van grade van vryheid in die stelsel ontwikkeling. Die term grade van vryheid het effens verskillende betekenisse, afhangende van of die konteks is formele statistieke of meganiese stelsels. Terwyl Belegging stelsel ontwerp dikwels trek uit beide kontekste, vir die doel van hierdie reeks sal ons baie nader aan die einde van skeef. In wese, die aantal grade van vryheid in 'n stelsel verwys na die aantal onafhanklike parameters in die stelsel wat resultate kan beïnvloed. Toe ek die eerste sistematiese belê ontdek, my intuïsie was om soveel maniere om te meet en te filtreer tydreekse as kan inpas op 'n Excel-werkblad te vind. Ek was soos 'n seuntjie wat 'n inspirasie bouillabaisse vir die eerste keer geproe het, en moes net om te probeer om dit te herhaal myself. Maar eerder as om te verken die eindelose nuanse van Franse kookkuns, Ek gooi net elke denkbare Franse plante in die pot in 'n keer. Naamlik een van my vroeë ontwerpe het nie minder nie as 37 klassifiseerders, insluitend filters wat verband hou met regressies, bewegende gemiddeldes, rou momentum, tegniese aanwysers soos RSI en Stochastics, sowel as liefhebber tendens en beteken terugkeer filters soos TSI, DVI, DWW, en 'n gasheer van ander drie en vier letter akronieme. Elke aanwyser is fyn om optimale waardes ten einde historiese opbrengste te maksimeer, en hierdie waardes verander as ek new teen verskillende effekte. Op 'n stadium ontwerp ek 'n stelsel om IWM handel met 'n historiese opbrengs van meer as 50% en 'n Sharpe verhouding oor 4. Dit is die soort van stelsels wat ongelooflik goed presteer in nawete en dan blaas in die produksie, en dis presies wat gebeur het. My vennoot toegepas die IWM stelsel tot tyd Amerikaanse voorrade vir 'n paar weke, en verloor 25%. Dosyne ure en weke van laat nagte by die rekenaar in die drein gooi. Die probleem met ingewikkelde stelsels met baie bewegende dele is wat hulle nodig het om die presiese perfekte punt van optimalisering in baie verskillende dimensies te vind in my geval, 37. Om te verstaan ​​wat ek bedoel met dit, dink probeer om 'n smaaklike gereg te skep met 37 verskillende bestanddele. Hoe kan jy ooit die perfekte kombinasie te vind? 'N bietjie meer sout kan bring die geur van die roosmaryn, maar kan die truffel olie oorweldig. Wat om te doen? Voeg sout en meer truffel olie? Maar meer truffel olie kan die aardsheid van die cantharellen nie aan te vul. Jy sien dit genoeg om net te vind die plaaslike optimale vir elke klassifiseerder individueel isnt, net so min as wat jy kan besluit oor die optimale bedrag van enige bestanddeel in 'n skottel sonder inagneming van die impak daarvan op die ander bestanddele. Dis omdat, in die meeste gevalle die sein van 'n klassifiseerder wisselwerking met ander klassifiseerders in nie-lineêre maniere. Byvoorbeeld, as jy werk met twee filters in kombinasie sê 'n bewegende gemiddelde kruis en 'n ossillator is jy nie meer bekommerd oor die optimale lengte van die bewegende gemiddelde (s) of die Terugblik periodes vir die ossillator onafhanklik; eerder, moet jy die resultate van die ossillator gedurende periodes ondersoek waar die prys is hoër as die bewegende gemiddelde, en weer wanneer die prys is laer as die bewegende gemiddelde. Jy mag vind dat die ossillator optree heel anders as die bewegende gemiddelde filter is in 'n staat as dit nie in 'n ander staat. Om jou 'n idee van die omvang van hierdie uitdaging te gee, oorweeg om 'n vereenvoudiging waar elke klassifiseerder het net 12 moontlike instellings, sê 'n Terugblik reeks 1 tot 12 maande. 37 klassifiseerders met 12 moontlike keuses per klassifiseerder verteenwoordig 6,6 x 10 ^ 18 moontlike permutasies. Terwyl 'n quintillion permutasies kan nie lyk soos 'n vereenvoudiging, is van mening dat baie van die klassifiseerders in my 37 dimensie IWM stelsel het twee of drie parameters van hul eie (kort Terugblik, lang Terugblik, Z-telling, p waarde, ens), en elke van daardie parameters is ook geoptimaliseer. Never mind vind van 'n naald in 'n hooimied, dit is soos die vind van 'n bepaalde sandkorrel op die strand. Daar is nog 'n probleem, asook: elke keer as jy die stelsel te verdeel in twee of meer state jy definitionally verminder die aantal waarnemings in elke staat. Om te illustreer, dink as elkeen van die 37 klassifiseerders in my IWM stelsel het net 2 state lank of kontant. Dan sou daar 2 ^ 37 = 137000000000 moontlike stelsel state. Onthou dat statistiese betekenisvolheid is afhanklik van die aantal waarnemings, sodat die aantal waarnemings per toestand van die stelsel te verminder verminder die statistiese betekenisvolheid van die waargenome resultate vir elke staat, en ook vir die stelsel in totaal. Neem byvoorbeeld 'n daaglikse verhandel stelsel met 20 jaar van die toets geskiedenis. As jy verdeel 'n 20 jaar ( 5000 dag) tydperk in 137000000000 moontlike state, sal elke staat het gemiddeld net 5000/137 miljard = 0,00000004 waarnemings per staat! Dit is duidelik dat 20 jaar van die geskiedenis isnt genoeg om enige vertroue in hierdie stelsel het; sou jy 'n toets tydperk van meer as 3 miljoen jaar moet statistiese betekenisvolheid te bepaal. As 'n reël, hoe meer vryheidsgrade jou model het, hoe groter is die steekproefgrootte wat nodig is om statistiese betekenisvolheid te bewys. Die omgekeerde is ook waar: gegewe dieselfde steekproefgrootte, 'n model met minder grade van vryheid is geneig om hoër statistiese betekenisvolheid het. In die belegging wêreld, as jy op soek is na-terug getoets resultate van twee belegging modelle met 'n soortgelyke prestasie, jy moet oor die algemeen het meer vertroue in die model met minder grade van vryheid. Op die heel minste, kan ons sê dat die resultate van dié model groter statistiese betekenisvolheid, en 'n hoër waarskynlikheid van die lewering van resultate in produksie wat in ooreenstemming is met wat waargeneem in simulasie is sou hê. Hoeveel bakkies bouillabaisse sal jy het om te proe om seker te wees youd het die perfekte kombinasie van bestanddele? As gevolg hiervan, optimalisering, kook, moet gedoen word op 'n geïntegreerde manier wat verantwoordelik is vir al die dimensies van die probleem in 'n keer. En dit is die dryfkrag agter die vreemde werklikheid wat dikwels in die belegging wêreld, soos met kook, beginners soek kompleksiteit, terwyl veterane soek eenvoud. Dit is counter selfs vir professionele beleggers, wat is die rede waarom stelsel ontwerp het 'n vreemde leerkurwe waar die neiging is om baie vinnig weg te beweeg van die eenvoudige benadering wat jy kennis gemaak met sistematiese handel in die eerste plek (in ons geval Fabers werk saam met die Chartiste en Dorsey Wright) in die rigting van uiters komplekse ontwerpe, elk met 'n baie presiese optimale omgewing. Uiteindelik jy erken die dwaasheid van hierdie strewe, en werk agteruit na samehang en eenvoud. Natuurlik, eenvoudige beteken nie maklik nie, kan nie meer as 'n beginner 'n eenvoudige resep volg om 'n kulinêre meesterstuk te skep. Soos jy sal ontdek, kan deurdagte eenvoud bedrieglik kompleks wees. Ons sal vir jou 'n voorbeeld van wat gee ons volgende artikel. Vir nou, kan jy slaag die sout en peper. Geskryf deur GestaltU op Woensdag, Februarie 5, 2014 by 05:30. [Vroeë stel onderhewig aan verandering.] Een van die vrae 'n instrutor dreads die meeste van 'n wiskundige ongesofistikeerde gehoor is, "Wat presies is grade van vryheid?" Dit is nie dat daar is geen antwoord nie. Die wiskundige antwoord is 'n enkele frase, "die rang van 'n kwadratiese vorm." Die probleem is die vertaling wat aan 'n gehoor wie se kennis van wiskunde nie langer as hoërskool wiskunde. Dit is een ding om te sê dat vryheidsgrade is 'n indeks en om te beskryf hoe om dit te bereken vir sekere situasies, maar nie een van hierdie stukke van inligting vertel wat grade van vryheid beteken. As 'n alternatief vir "die rang van 'n kwadratiese vorm", het ek altyd geniet Jack Good se 1973 artikel in die Amerikaanse Statistikus "Wat is grade van vryheid?" 27, 227-228, in wat gelykstaande is hy vryheidsgrade om die verskil in dimensionalities van parameter ruimtes. Dit is egter 'n gedeeltelike antwoord. Dit verduidelik wat grade van vryheid is vir baie chi-kwadraattoetse en die teller grade van vryheid vir F-toetse, maar dit beteken nie so goed doen met t-toetse of die deler grade van vryheid vir F-toetse. Op die oomblik is, ek is geneig om grade van vryheid definieer as 'n manier om telling. A datastel bevat 'n aantal waarnemings, sê, N. Hulle vorm N individuele stukkies inligting. Hierdie stukkies van die inligting kan óf gebruik word om parameters of variasie skat. In die algemeen, elke item word beraamde koste een graad van vryheid. Die oorblywende grade van vryheid word gebruik om variasie te skat. Al wat ons moet doen, is om behoorlik te tel. 'N Enkele voorbeeld: Daar is N waarnemings. Daar is 'n parameter (die gemiddelde) wat gevolg moet word geskat. Dit laat n-1 vryheidsgrade vir die beraming van variasie. Twee monsters: Daar is n 1 + N 2 waarnemings. Daar is twee maniere om geskat word. Dit laat n 1 + N 2 -2 grade van vryheid vir die beraming van variasie. Eenrigting ANOVA met g groepe: Daar is n 1 + .. + N g waarnemings. Daar is g beteken word geskat. Dit laat n 1 + .. + N g G grade van vryheid vir die beraming van variasie. Dit is verantwoordelik vir die deler grade van vryheid vir die F-statistiek. Die primêre nulhipotese getoets deur one-way ANOVA is dat die g bevolking middel gelyk is. Die nulhipotese is dat daar 'n enkele gemiddelde. Die alternatiewe hipotese is dat daar g individuele beteken. Daarom is daar g-1 --that is g (T 1) minus 1 (H 0) - grade van vryheid vir die toets van die nulhipotese. Dit is verantwoordelik vir die teller grade van vryheid vir die F-verhouding. Daar is nog 'n manier van die lees van die teller grade van vryheid vir die F-verhouding. Die nulhipotese sê daar is geen variasie in die g bevolking beteken. Daar is g monster middel. Daarom is daar g-1-grade van vryheid vir die beoordeling van variasie onder die g middel. Meervoudige regressie met p voorspellers: Daar is N waarnemings met p + 1 parameters te beraam - een regressie coeffient vir elk van die voorspellers plus die afsnit. Dit laat n-p-1 vryheidsgrade vir foute, wat verantwoordelik is vir die fout grade van vryheid in die ANOVA tafel. Die nulhipotese getoets in die ANOVA tafel is dat al koëffisiënte van die voorspellers is 0. Die nulhipotese is dat daar geen koëffisiënte word geskat. Die alternatiewe hipotese is dat daar p koëffisiënte word geskat. Hiertoe werk, daar is p-0 of p grade van vryheid vir die toets van die nulhipotese. Dit is verantwoordelik vir die Regressie grade van vryheid in die ANOVA tafel. Daar is nog 'n manier van die lees van die regressie-grade van vryheid. Die nulhipotese sê die verwagte reaksie is dieselfde vir alle waardes van die voorspellers. Daarom is daar 'n parameter te skat - die algemene reaksie. Die alternatiewe hipotese spesifiseer 'n model met p + 1 parameters-- p regressiekoëffisiënte plus 'n onderskep. Daar is dus p --that is p + 1 (H 1) minus 1 (H 0) - regressie grade van vryheid vir die toets van die nulhipotese. Goed, so waar is die kwadratiese vorm? Kom ons kyk na die variansie van 'n enkele voorbeeld. As y is 'n N deur 1 vektor van waarnemings, dan Die aantal grade van vryheid is gelyk aan die rang van die N deur n matriks M. wat is N-1. [Terug na The Little Book of Statistiese Praktyk]


No comments:

Post a Comment