Rozhovor s Dr. Jess Stauth o procesu výběru algoritmů do Quantopianu
Americký Quantopian naplňuje postupně svoji poměrně revoluční myšlenku demokratizace průmyslu hedgových fondů, kdy investiční kapitál alokuje po milionech dolarů do strategií vyvíjených svými uživateli. A těmi může být kdokoliv, kdo má dostatečné znalosti v oblasti obchodování a osvojí si ovládání bezplatné platformy, kterou Quantopian zpřístupnil na internetu. Mnoho obchodníků jistě zajímá, jak investiční společnost své strategie vybírá, co a jak posuzuje. A právě o tom jsme si povídali s Dr. Jess Stauth, ředitelkou výzkumu Quantopianu, která má finální posuzování strategií v Quantopianu na starost.
Quantopian nezmiňuji na Finančníkovi poprvé. Prakticky jde o společnost pro správu investic, která svěřený investiční kapitál spravuje pomocí strategií vytvářených svými uživateli. Strategie se pomocí Pythonu vytváří přímo v bezplatných nástrojích vyvinutých Quantopianem. Ten současně poskytuje bezplatná data, mnoho inspirace a výuky, která podle mého názoru není v podobné míře na internetu vůbec běžná a ze které mohou čerpat i obchodníci, kteří o alokaci svých strategií do Quantopianu neuvažují.
Z úspěšných strategií vybraných pro investování ve společnosti mají tvůrci příslušný podíl na zisku (viz Getting Capital Allocations from Quantopian). Podíl představuje aktuálně 10 % z alokovaného kapitálu dané strategie. Její medián je nyní podle stránek Quantopianu 1,5 milionu dolarů s cílem průměrné alokace 5-10 milionů dolarů na algoritmus ke konci roku 2017. Tedy solidní motivace pro mnoho obchodníků, kteří věří, že jejich strategie a přístupy jsou vhodné pro zhodnocování institucionálních investic.
Dr. Jess Stauth se svojí přednáškou na QuantConu
Jak dokáže Quantopian vybrat z množství vyvíjených strategií ty, kterým bude věřit natolik, aby je nechal obchodovat investiční kapitál? O tom jsem si v New Yorku pro Finančník.cz povídal s Dr. Jess Stauth, ředitelkou výzkumu Quantopianu, která rozhoduje o finálním posuzování strategií.
Strategie, které používá Quantopian v rámci správy kapitálu, pochází pouze od vašich uživatelů, nebo máte současně vlastní tým analytiků připravujících vlastní strategie?
Celou společnost stavíme jednoznačně na přístupu, kdy všechny zisky jsou generovány strategiemi z komunity našich uživatelů, se kterou interně nesoutěžíme. Nevytváříme proto vlastní strategie. V tomto jsme naprosto transparentní, a naši uživatelé tak mají jistotu, že v oblasti alokace kapitálu s Quantopianem nesoupeří.
Na čem sami pracujeme je proces vybírání algoritmů od uživatelů pro využití při správě investic. A následně vytváření systémů pro celkové řízení risku a portfolia složené z vybraných algoritmů uživatelů.
Soustředíme se tedy na otázky typu – jak přeměnit dobré myšlenky uživatelů do portfolia s kvalitním risk managementem, které bude vhodné pro institucionální investory?
Řadu uživatelů patrně zajímá, zdali Quantopian při posuzování strategií vidí i samotný kód systémů, a tudíž naprosto celou obchodovatelnou myšlenku?
Ne, všechen kód je uchováván v šifrované podobě. A nikdo ze zaměstnanců analytického a investičního oddělení Quantopianu nemá ke zdrojovému kódu přístup.
Pokud ale někdo potřebuje s kódem pomoct, tak může poslat žádost na podporu a poskytnout jim povolení k přístupu k algoritmu. To je prakticky jediná příležitost, kdy se dostáváme do styku se zdrojovým kódem uživatelů.
Co se týče algoritmů vybraných pro alokování kapitálu. U nich také nevidíme zdrojový kód, ale jakmile je algoritmus vybrán k živému obchodování s naším kapitálem, tak od uživatelů vyžadujeme dodatečnou míru transparentnosti. A to konkrétně v podobě popisu jakýchkoliv změn, které budou na strategii provádět. Chceme pak tedy vidět pouze ty řádky kódu, které autor změnil. Pokud autor například změní řádek s definicí trhů, které systém obchoduje, chceme vidět pouze daný změněný řádek kódu.
Takže ani u strategií, kterým alokujete kapitál, nevidíte zdrojový kód?
Ano, přesně tak.
Takže kompletní rozhodování o začlenění strategie do Quantopianu je založeno na studování statistik z backtestu strategie a výkonnosti v out of sample?
Ano, strategie posuzujeme na základě výsledků backtestu a out of sample obchodování. Případně strategii paper tradujeme a můžeme ji různě testovat.
Současně také po autorech požadujeme, aby nám základní principy strategie vysvětlili. A ideálně také popsali, jaká data strategie používá. Je to především z důvodu, že jsme přesvědčeni, že je důležité, aby obchodovatelná strategie měla racionální základ. Strategie mohou být hodně sofistikované a používat nejrůznější moderní techniky. Ale pokud nemají vysvětlitelný ekonomický fundament fungování, je velmi složité takovým strategiím věřit. Po autorech strategií potenciálně vybraných pro naši investiční společnost chceme tedy vyplnit určitý mini due diligent dotazník vysvětlující princip strategie. Ten pak můžeme porovnat s charakteristikami backtestu strategie. A jednou ze základních věcí, kterou sledujeme na samém začátku je to, zdali nám vše souhlasí. Jestli například charakter profitů a risku backtestu odpovídá chování, které lze očekávat od popsané charakteristiky systému.
Autor může například popsat, že strategie vychází z obchodování momenta. V takovém případě se můžeme například podívat na korelaci výsledků s Fama–French momentum portfolia. A pokud zde žádná korelace není, je záporná nebo je velmi sporadická, pak chceme model více vysvětlit, protože dodaný popis neodpovídá tomu, co bychom od modelu na základě popisu očekávali. A upřímně, autoři tento proces vnímají velmi pozitivně, protože se často z našich analýz hodně naučí o svých vlastních strategiích. Někdy jim to pomůže některé prvky strategie opravit a zlepšit.
Dají se popsat typické strategie, které prošly výběrem pro alokování kapitálu v Quantopianu?
Určitě. V rámci Quantopianu cílíme na specifický typ investičního nástroje, který nabízíme investorům. V tuto chvíli jsou to strategie založené na amerických akciích a ETFs. Strategie, které jsou market neutrální a v ideálním případě beta neutrální. Cílíme na strategie se střední frekvencí obchodování. To v praxi znamená několik obchodů denně až po několika týdenní držení pozice. Tedy strategie, které dokáží rychle reagovat na možnou změnu tržního prostředí.
Tedy například typické trend-following modely už jsou příliš dlouhodobé?
Ano, přesně tak. Klasické trend-following modely už budou z našeho pohledu obchodovat nejspíše příliš pomalu.
Navíc v našem případě bychom patrně zahrnuli trend-following do našeho portfolia v případě, že bude vycházet z principu obchodování relativní hodnoty v rámci určitého sektoru, kde by systém současně například nakupoval akcie se silným rostoucím momentem a současně prodával akcie se silně klesajícím momentem.
Pro váš kapitál tedy hledáte strategie, které obchodují současně long/short, případně se alespoň neustále v trhu zajišťují opačnou pozicí?
Ano, strategie by měly používat hedge. Ideálně by mělo jít o long/short strategie, kde short je prováděn pomocí jednotlivých akcií. U tohoto stylu vnímáme nejvyšší přínos v oblasti diverzifikace.
Pokud jste například long v akciovém portfoliu a short řekněme pomocí SPY, tedy ETFs sledující pohyb indexu S&P 500, pak jste limitován tím, že SPY má stejnou expozici pro různé tržní sektory. Kdežto vaše akciové portfolio může mít vůči daným tržním sektorům jinou expozici. Tedy můžete se zajistit pozicí ve SPY, ale i přesto skončit s výraznou nezajištěnou expozicí vůči pohybu určitého sektoru. Sofistikovanější alternativou je tak vzít například několik specializovaných sektorových ETFs, explicitně vypočítat expozici portfolia vůči jednotlivým sektorům, a zajistit portfolio příslušným množstvím sektorových ETFs. To může fungovat docela dobře. Nicméně na druhou stranu je pak například potřeba dobře pracovat s výběrem dostatečně likvidních sektorových ETFs. Použití nedostatečně likvidního instrumentu může být jeden z důvodů, proč strategie nedostane v Quantopianu alokaci kapitálu. Ale i v této oblasti se snažíme s autory komunikovat a často lze najít alternativu v dostatečně likvidním nástroji.
Na QuantConu jste zmiňovala, že každý měsíc analyzujete stovky strategií, které uživatelé Quantopianu posílají k posouzení a potenciálnímu zařazení ke správě kapitálu v rámci Quantopianu. Jaké jsou tedy typické důvody odmítnutí strategie? Jakým procesem postupují strategie, aby bylo takové množství práce vůbec možné zvládnout?
Ano, strategie procházejí určitým procesem analýzy a velké množství se jich ke mně vůbec nedostane. Jsou to například strategie, které mají dlouhodobě hodně vysokou korelaci s indexem, pochopitelně dlouhodobě ztrátové strategie, strategie obchodující bez zajištění a například velmi volatilní strategie. To je ale zhruba všechno. Pokud tedy například obchodník pošle jednoduchou long only strategii obchodující jediný instrument na základě určitých vstupních a výstupních patternů, pak takovou strategii patrně vůbec neuvidím. Tak to máme nastavené dnes. Ale je samozřejmě možné, že pravidla pro výběr strategií se mohou v budoucnu měnit.
Ukázka strategie, která neprošla procesem výběru. Strategie neměla dostatečnou výkonnost v out of sample ověření, které se provádí 6 měsíců. Mj. proto, že akademické studie ukazují, že pokud má strategie v out of sample testování o délce 6 měsíců alespoň sharpe ratio 1, existuje 75% šance, že pozitivní sharpe ratio bude i v budoucnosti.
Strategie, které projdou základním filtrem procházím s kolegy ručně. Velmi častými chybami jsou pak ty, o kterých jsem hovořila na své přednášce na QuantConu. Sleduji například dlouhodobou beta strategie (pozn. redakce – korelace s indexem). Naším základním filtrem je průměrná beta pod cca 0.3. Tato podmínka je filtrována automaticky. Nicméně sama sleduji, zdali strategie nemá občasná krátká období, kdy beta prudce vzroste. I toto by se dalo automatizovat, nicméně v tuto chvíli posuzuji podobné negativní hodnoty v kontextu dalších výkonnostních ukazatelů strategie.
Hledáme také skutečně diverzifikované strategie. Sledujeme tak například počet obchodů v různých trzích. Pokud strategie obchoduje stále dokola jen několik trhů, které nejsou dobře hedgovány, tak to pro naši společnost není zajímavé. Typická situace, která by neprošla tímto filtrem, je strategie pracující například s portfoliem 10 akcií, kterým jsou přiřazeny trvale fixní váhy.
Bez ohledu na samotný kód tak z analýz vidím, jestli byly profity generovány například jedním ETF nebo pomocí long/short portfolia dynamicky vytvářeného koše akcií. Takový model je pro Quantopian pochopitelně mnohem atraktivnější.
Analýza obchodovaných titulů mně také pomáhá udělat si představu o tom, jestli systém obchoduje například diverzifikované portfolio velkých likvidních akciových titulů nebo koncentrované portfolio microcaps akcií.
Analýzy, o kterých hovoříte, jsou součástí modulu pyfolio, který jste také uveřejnili jako open source, je to tak? Používáte pro vyhodnocování strategií sama tento nástroj?
Ano, jsou součástí pyfolia, který je k dispozici zde na githubu .
Pyfolio sama používám prakticky exkluzivně právě pro analýzy strategií určených pro potenciální nasazení v Quantopianu. Určitě je to dobrý nástroj, který bych doporučila používat pro detailní analýzu backtestů. Pokud backtestujete své strategie v Quantopianu, jsou tyto nástroje propojené. V rámci základního backtestu si stačí poznamenat identifikátor backtestu, a ten pak jen zadat do prostředí pyfolia, které je na Quantopianu zdarma k dispozici. Získáte tak velmi podrobné analýzy, se kterými sama pracuji.
Ukázka další strategie, která neprošla procesem výběru. Algo se příliš exponuje do dlouhých pozic (není market neutrální) – má beta až 0.5. Statistiky pochází z open source modulu pyfolio, který je také zdarma integrovaný do Quantopianu.
Ukázka další strategie, která neprošla procesem výběru. Horní screenshot ukazuje dobrou out of sample výkonnost strategie. Strategie prošla i dalšími testy, ty ale současně ukázaly, že je obchodováno velké množství méně likvidních akcií. Quantopian nabízí tzv. dataset Q1500, který každý den obsahuje 1 500 nejlikvidnějších amerických akcií vhodných i pro obchodování větších pozic nezbytných pro exekuce v rámci investiční společnosti. Spodní screenshot ukazuje, že obchodování strategie na tomto datasetu nabízí již výrazně horší výsledky.
Nyní máte v Quantopianu také futures data. Plánujete tedy rozšířit portfolio i o futures strategie?
Určitě. Futures strategie plánujeme zapojit do současného investičního nástroje.
U strategií typicky vyžadujeme 6 měsíců out of sample obchodování. Nyní jsou tedy obchodníci schopni pracovat s futures daty, provádět výzkum a backtesty. Za šest měsíců bychom tak mohli mít první strategie po out of sample ověření připravené pro alokaci kapitálu.
Plánujete do platformy přidat opční data?
Po futures myslím přijdou na řadu spíše mezinárodní akcie, na které můžeme využít naši stávající infrastrukturu. Dá se také předpokládat, že lidé mohou snáze využít své kódy připravené pro americké akcie.
Skrz svoji pozici máte jistě možnost vnímat mnoho obchodníků, kteří se snaží vydělávat pomocí algoritmických strategií, ale nejsou zatím úspěšní. Máte pro ně nějaké doporučení?
Quantopian umožňuje obchodníkům také automatizovaně obchodovat své strategie na svých vlastních účtech u dvou brokerů (Interactive Brokers a Robinhood). Dnes již na to nemám čas, ale před lety jsem sledovala obecné statistiky výkonnosti obchodníků, neboť jsme jim chtěli poskytnout co nejlepší nástroje právě proto, aby neztráceli peníze. Z mého pohledu je důležité začít především u analýzy expozice risku. V tomto ohledu se snažíme obchodníky na Quantopianu také hodně vzdělávat . A musím říct, že se nám naše snažení vyplácí, neboť u live obchodníků na naší platformě vidíme velmi konzervativní přístupy bez toho, aniž by se obchodníci neustále obměňovali.
Osobně bych si také dala pozor na přemýšlení pouze nad profity bez ohledu na vynaložený risk. A pokud člověk realisticky a upřímně přemýšlí o risku, má mnohem, mnohem vyšší šance pohybovat se v trhu dostatečně dlouho na to, aby se naučil obchodovat lépe a lépe.
Děkuji moc za rozhovor.
Postřehy z newyorského QuantConu
V sobotu proběhla v New Yorku konference algoritmického obchodování QuantCon, na které jsme nemohli chybět. Co mě zaujalo z pohledu využitelnosti do vlastního obchodování?
QuantCon mám rád hlavně proto, že se v něm do velké míry prolíná svět hedgových fondů s obchodováním jednotlivců. Přednášky jsou často orientovány na profesionálnější témata a poskytují nemalé možnosti inspirace. Tedy zejména z pohledu retailového obchodníka, který nemá jinak příliš šancí nahlédnout „do kuchyně chytrých peněz“. S tím se pochopitelně pojí i možnost neformálních diskuzí s lidmi, které je opět jinak velmi těžké potkat.
Jaká hlavní témata na QuantConu zaznívala? Tak v prvé řadě jsou to alternativní data, se kterými dnes hedgové fondy dost pracují a snaží je zpracovávat do strategií. Je zřejmé, že pokud chce v tradingu obchodník uspět, musí se neustále posouvat dopředu. Existující výhody v trhu se vyčerpávají s tím, jak je postupně obchoduje více a více obchodníků. Alternativní data jsou jednou z cest, jak nalézat nové výhody. Už jen proto, že v dnešní digitální době vzniká neuvěřitelné množství nových dat, které lze zpracovávat a vyhodnocovat. Padaly příklady strategií vyhodnocujících ekonomické trendy například prostřednictvím vytíženosti parkovišť před nákupními centry atd. Osobně v podobných směrech také vidím budoucnost, byť pochopitelně z pohledu retailových obchodníků existuje řada limitů, kam je možné ještě jít. Určitě je ale potřeba maximálně se zkoušet dívat na data z různých i méně tradičních pohledů. Ať už je to například méně využívaný timeframe (a způsob jeho zpracování) nebo zapojení sice dostupných dat, které ale mnoho traderů nepoužívá (prezentován byl například obchodní přístup statistického vyhodnocování reakcí ceny na hospodářské výsledky společností, což je něco, s čím sám také ve svých analýzách pracuji).
John Fawcett, CEO Quantopianu zahajuje QuantCon
V souvislosti s alternativními daty padlo na QuantConu několik oznámení, která jsou velmi zajímavá i pro výzkum v oblasti retailových strategií. Hlavní je patrně zpřístupnění dat společnosti Factset v on-line platformě Quantopian. Data by, stejně jako celá platforma, měla být pro výzkum zdarma. Upřímně právě dostupnost velkého zdroje alternativních dat v Quantopianu (přehled viz www.quantopian.com/data) je z mého pohledu velkým důvodem, proč platformu využívat. Sám jsem se kvůli tomu učil Python. Data jsou v tradingu drahá a Quantopian je jedno z málo míst, kde je řada profesionálních zdrojů dostupná zdarma, případně za malý poplatek. Nově bude také možné na servery Quantopianu nahrávat přes API vlastní data a ta následně využívat například coby individuální filtry a váhy v testovaných algoritmech.
Druhým velkým tématem konference bylo téma strojového učení využitelného v tradingu. Jelikož běžel program paralelně v přibližně 5 sálech, ještě jsem nezpracoval všechny přednášky (byly nahrávány, takže je možné se podívat i na ty, kterých se člověk osobně nezúčastnil), ale z těch, které jsem navštívil, bylo zřejmé, že: Velcí hráči s různými technikami strojového učení samozřejmě experimentují, ale není to vůbec triviální záležitost. Osobně se mi zdálo, že větší úspěch mají spíše v dílčích aplikacích – například automatických hledání souvislostí v alternativních datech nebo používání taktik strojového učení pro určování vah signálů v portfoliích atd. Hodně se také řešilo, jak se vyvarovat přeoptimalizaci generovaných systémů. Velmi inspirativní byla závěrečná přednáška Dr. Marcose Lopeze de Prado, který se tomuto tématu věnuje dlouhodobě. Prakticky demonstroval problém, o kterém jsem na Finančníkovi hovořil mnohokrát, zejména v AOS kurzu. Pokud budeme na stejných datech dělat dostatečně dlouhé pokusy (tedy například datamining), dříve nebo později získáme krásně vypadající strategie včetně ověření robustnosti v OOS, které ale nemají šanci v praxi dlouhodobě přežít. Tedy při testování a vývoji je potřeba sledovat i cesty vedoucí k výsledné strategií (například počet pokusů optimalizace) a tomu přizpůsobit i vyhodnocení robustnosti. Toto je myslím velké téma, o kterém se bude ještě hodně hovořit. Prado na toto téma publikoval před týdnem zajímavou práci Detection of False Investment Strategies Using Unsupervised Learning Methods, která je sice odborná, ale může poskytnout inspiraci, jak se k problému stavět.
Co se týče úspěšného vytváření strategií, tak opět mnohokrát zaznělo, jak důležitý je výzkum v oblasti obchodovaného edge. A že ti, co uspějí (například na Quantopianu), mají za sebou násobně více hodin strávených nad výzkumem než jiní obchodníci. A také důležité připomenutí, že backtest strategie není výzkum, ale spíše ověření funkčního edge zasazeného do kontextu konkrétního obchodního plánu. Inspirativní byl pro mě workshop, který mi připomněl existenci bezplatného nástroje Alphalens umožňujícího právě testovat různé alfa factory (z pohledu terminologie používané na Finančníkovi tedy určité obchodované „edge“ = výhody) v prostředí pythonovského Notebooku, který sám hodně pro testování využívám. Řada podobných nástrojů je neuvěřitelně praktická, což ale člověku bohužel dojde až v momentě, kdy vidí vše konkrétně vysvětleno na praktických příkladech. A i to je důvod, proč jsem přesvědčený, že podobné akce stojí za účast.
Potkáme se na neyworském QuantConu?
26.4.2018 proběhne v New Yorku další ročník konference algoritmického obchodování – QuantCon. Finančník na ní nebude chybět. Pokud se také do New Yorku v tuto dobu (nebo na stejnou akci) chystáte, dejte vědět.
QuantCon představuje z mého pohledu jednu z aktuálně nejlepších akcí, kterou je možné v zahraniční absolvovat, pokud hledáte nové kontakty a inspiraci v oblasti algoritmického obchodování. Letos se bude konat 26.4.2018 v New Yorku. Účastníci z řad čtenářů našeho serveru mohou použít slevový kupón FinancnikQuantCon2018 a získat slevu ze vstupného. Podrobné info o akci naleznete na adrese https://quantconnyc2018.splashthat.com.
New York mám moc rád, a tak ani letos účast na QuantConu nevynechám. Věřím, že se mi opět podaří pro Finančník.cz sepsat z akce zajímavé tipy, případně zorganizovat rozhovor. Pokud ale plánujete být také přímo na konferenci, dejte vědět a rád se potkám.
Proč je QuantCon z mého pohledu zajímavý?
Konferenci pořádá Quantopian.com – což je zjednodušeně řečeno fond využívající pro získávání strategií crowdsourcing. Strategie obchodované ve fondu jsou vybírány od traderů aktivních na platformě Quantopian.com. Aby pak server přitáhl na své stránky tradery, s jejichž strategiemi se dají spravovat miliony dolarů, poskytuje zdarma všem uživatelům slušné technologické zázemí a vzdělávání. Zmiňoval jsem se o něm několikrát. De facto jsou k dispozici bezplatná data na futures i akcie, testovatelná v podobě bezplatného portfolio testeru. Vše se ovládá přes Python, je otevřené, a tak i snadno přenositelné pro vlastní obchodování.
Bohužel Quantopian není platforma pro začátečníky a neprogramátory. Ale tím, že je zdarma, poskytuje z mého pohledu solidní motivaci zkoušet ji ovládat a postupně se posouvat dopředu. Jak v algoritmickém obchodováním, tak v práci s Pythonem. Pro mě osobně byl Quantopian právě jeden z důvodů, proč jsem před lety začal intenzivněji studovat tento programový jazyk, což je znalost, ze které těžím v tradingu dnes stále více.
Motivací pro studium Pythonu, resp. Quantopian platformy, je z mého pohledu i hodnotná výuka zpracovaná bezplatně do tutoriálů, které naleznete na adrese https://www.quantopian.com/lectures. Opět. Není to látka pro začínající tradery, ale ohromná možnost inspirace pro obchodníky, kteří hledají diverzifikaci například v podobě institucionálních strategií (řada tutoriálu je zde například na taktiky párového obchodování, se kterým sám pracuji), případně hlubšího porozumění aplikací různých statistických a matematických metod.
Poskytnutými nástroji a výukou k sobě Quantopian přitahuje vesměs podobně uvažující pokročilejší obchodníky. A z tohoto pohledu je pro mě právě QuantCon zajímavý. Člověk zde má příležitost navázat opravdu zajímavé kontakty. Nicméně pokud je pro vás konference z ruky, stále bych doporučil projít diskuzní fórum a tutoriály, které jsou na Quantopian.com publikované. Dají se tam načerpat různé myšlenky. Případně jsou z konference poskytovány záznamy, které je možné si na stránce QuantConu objednat.