Мера похожести на индекс

Наблюдая за блогером finindie возник вопрос:

Допустим он собирает портфель из отдельных акций типа повторяя индекс, но там есть повышающие \ понижающие коэффициенты для отдельных акций, какие то акции с малой долей в индексе выкидываются, приведение к целевым весам через пополнение без продаж, что например не ограничивает долю Лукойла до 15% и т.д.
https://snowball-income.com/public/portfolios/UQqAIwzzQO

Как говорится сомнительно, но окей, можно представить, что человек не доверяет БПИФам или не хочет перебегать из фонда в фонд при повышением комиссии попадая при этом на налоги.

Но можно ли сделать еще проще? взять первые N акций из индекса (или не первые N, а как то умнее, те N которые лучше воспроизводят индекс, если это не тоже самое) и например если по какой то метрике они на 90% повторяют индекс, то сказать мне и так окей, так вот какую метрику тут нужно брать?

Поговорив с chatgpt он мне предложил по этому поводу коэффициент корреляции, бета коэффициент(рассчитывается в snowball https://snowball-income.com/public/portfolios/UQqAIwzzQO#scores ), коэффициент детерминации (R^2), что же используется на практике и имеет ли значение за какой интервал времени берется каждое значение в массиве (день, месяц, год)?

Если мы ограничиваемся только акциями из индекса имеет ли смысл вычислять что то типа MAE, MSE для массива из весов с которыми входят акции в портфель для сравнения?

16 комментариев 👇
Павел Комаровский, Помогаю управлять капиталом 24 февраля в 06:48

Детально не копался в этом вопросе, готового ответа нет. Но я бы поискал про то, как индексные ETF подходят к этому вопросу - у них этот вопрос регулярно встает, как с помощью sampling следовать за индексом проще и эффективнее, чем с помощью полной репликации.

То есть, понятно, что смотрят на Tracking Error в том числе: https://www.investopedia.com/terms/t/trackingerror.asp

Но, может, есть какие-то еще соображения.

  Развернуть 1 комментарий

@PavelKomarovskiy, вот еще нашел статью https://capital-gain.ru/posts/how-many-stocks-are-required-for-a-diversified-portfolio/ там изначально вопрос немного по другому ставится, но там используют std dev, tracking error, R^2

Но еще не совсем понятно, допустим мы говорим "цель заключается в том, чтобы построить портфель с R2, равным 0,90, когда 90% дисперсии объясняется рынком, мы полагаем, что для этого потребуется около N акций в портфеле", но беспокоит то что если так построить портфель, то можно потом через 10 лет удивится от разницы в CAGR с индексом ( например MCFTR vs MRBCTR https://capital-gain.ru/app/funds/compare/?tickers=MRBCTR%2CMCFTR¤cy=RUB )

Вроде бы можно использовать tracking error для оценки ΔCAGR≈Tracking Error×sqrt(T), где T кол-во лет, но зачем нам тогда коэффициент детерминации (R^2)?

  Развернуть 1 комментарий

@allin, не уверен, что будущую дельту к КАГР можно как-то однозначно вывести из tracking error.)

  Развернуть 1 комментарий

@allin, вот здесь я обсуждаю некоторые метрики и их нюансы, а также предлагаю свои. Но вообще, цель вашего интереса мне не совсем ясна, а от неё может многое зависеть.

  Развернуть 1 комментарий

@blksv, цель собрать портфель с меньшим кол-вом акций чем в индексе который на 90%(или 95%/99%) повторяет индекс и как то еще оценить насколько это будет хуже чем индекс.

  Развернуть 1 комментарий

@allin, ну тогда я бы советовал смотреть на характерную скорость отставания и среднюю накопленную ошибку отслеживания. Только вот зачем вам это? Примерить на себя роль управляющего индексным фондом с optimized sampling? Ежедневное отслеживание динамики расхождения индекса с портфелем, корреляций отдельных акций с индексом, расчёт и изменение развесовки, чтобы с минимальными издержками вернуть динамику на место, и всё такое?

  Развернуть 1 комментарий

@blksv, "Ежедневное отслеживание динамики" не предполагалось, может можно 1 раз на исторических данных померить? например насколько ухудшает результат отброс акций которые имеют вес меньше 0.4% в индексе (и которые с большей вероятностью из него вылетят).

  Развернуть 1 комментарий

@allin, ну, ответ на такой вопрос, конечно, дать можно. Только трудоёмкость такого бэктеста, по-моему, очень сильно превышает ценность этого ответа. Положим, ответ будет, что вы можете выкинуть эти 15 акций из индексного портфеля без значимых потерь в точности отслеживания и доходности. Какие практические выводы из этого ответа могут быть сделаны?

  Развернуть 1 комментарий

@blksv, тогда можно будет выкинуть эти акции и купить только первые N из индекса, состав будет реже меняться и чем меньше N тем легче этим управлять(если делать это руками).

  Развернуть 1 комментарий

@allin, по моим интуитивным прикидкам, трудозатраты на написание корректного бэктеста (+ автоматизацию расчётов собственного сокращённого индекса) будут таким образом окупаться добрый десяток лет: потому что ребалансировки индекса чаще затрагивают топ-5 из-за изменения ограничивающих коэффициентов, а включение/исключение компаний хотя и тяготеет к малым капитализациям, но затрагивает отнюдь не только последние 10-15 позиций, которые вы хотите исключить.

Во-вторых, выгоду самостоятельного собирания индекса по сравнению с покупкой индексного фонда вы уже установили в каком-то другом расчёте?

  Развернуть 1 комментарий

@blksv,

включение/исключение компаний хотя и тяготеет к малым капитализациям, но затрагивает отнюдь не только последние 10-15 позиций, которые вы хотите исключить.

вы имеете ввиду что вес может изменится и у средней акции в сторону уменьшения, которую мы до этого не обрезали? или вы имеете ввиду исключение из индекса по какой то другой причине?

выгоду самостоятельного собирания индекса по сравнению с покупкой индексного фонда вы уже установили в каком-то другом расчёте?

тут речь не про выгоду, скорее про концептуальное решение не покупать фонды, в посте были указаны предположительные причины "человек не доверяет БПИФам или не хочет перебегать из фонда в фонд при повышением комиссии попадая при этом на налоги."

  Развернуть 1 комментарий

@allin, веса (точнее, коэффициент, применяемый к капитализации для расчёта веса) меняются у всех акций — меняется free-float, меняются ограничивающие коэффициенты. Также и вылетают из индекса компании отнюдь не только (и даже не столько) из-за падения капитализации.

Вообще, предлагаю посмотреть на вопрос с другой стороны. Индекс Мосбиржи ребалансируется 4 раза в год, в каждую ребалансировку добавляются-вылетают в среднем 2-4 компании. Отбросив последние 10-15 вы в лучшем случае сэкономите 2 транзакции: если компания вылетит из индекса так и не преодолев установленного вами барьера. Это 8 транзакций в год. Сколько добавочного времени у вас в среднем ушло бы на выставление соответствующих заявок? Минуты 2-3 на заявку максимум.

Одновременно появится задача по независимому расчёту весов (акций-то меньше) и учёту капитализации компаний, которые уже в индексе, но ещё не в вашем портфеле: т.е. просто в табличку от Мосбиржи уже не посмотришь.

Т.е. мы сейчас обсуждаем экономию времени порядка 20 минут в год при неопределённых дополнительных затратах. Мне кажется, только на обдумывание этого вопроса и только своего времени вы уже потратили больше, чем (может быть!) могли бы сэкономить на таком отбрасывании в ближайшие лет десять-пятнадцать.

  Развернуть 1 комментарий
Investigator, IT System Administrator 14 марта в 19:15

finindie живет рынком, рынок для него вся жизнь. Не думаю, что кому-то стоит его повторять и каждый год декларировать вручную 2500 строчек дивидендов, следить какие акции какую долю занимают в индексе, как-то пытаться его оптимизировать, это все для любителя, мягко скажем. Гораздо прибыльнее было бы сосредоточится на повышении дохода путем развития професиональных навыков или тратить время на создание своего дела, а разницу между доходами и расходами инвестировать.

  Развернуть 1 комментарий

@Investigator,

декларировать вручную 2500 строчек дивидендов

Для акций РФ же не надо ничего декларировать? (для депозитарных расписок вроде надо было)

Я кстати не знаю как он реинвестирует дивиденды в тот же день как пришли или раз в месяц закидывает с зарплатой (ну судя по покупкам в какие то рандомные даты докупки происходят https://snowball-income.com/public/portfolios/UQqAIwzzQO#transactions даже не связанные с датами дивидендов https://snowball-income.com/public/portfolios/UQqAIwzzQO#income ), в любом случае у него не стоит задача прямо точно повторить индекс с учетом того что у него понижающие\повышающие коэффициенты на отдельные акции и то что там сейчас у него всего 40 акций, т.е. меньше чем в индексе.

  Развернуть 1 комментарий

@allin, я его смотрел в году 2020-2021, у него было 2500 позиций по самым разным акциям США, их на тот момент надо было ввести налоговую декларацию отдельно с учетом курса на момент получения. Это с его слов в одном из видео. Что там с акиями РФ я не вкурсе.

  Развернуть 1 комментарий
Георгий Перов, Программист автор 14 марта в 19:28

Относительно метрик, сама биржа для отдельных акций считает factora, factorb, influence, determinat еще бы понять как они рассчитываются и за какой промежуток.

Пример:
http://iss.moex.com/iss/statistics/engines/stock/markets/index/analytics/IMOEX/tickers/SBER.json?from=2025-03-14&till=2025-03-14

  Развернуть 1 комментарий

😎

Читать можно всем, но комментирование доступно только участникам Клуба.

Что вообще здесь происходит?


Войти