Мера похожести на индекс
Наблюдая за блогером finindie возник вопрос:
Допустим он собирает портфель из отдельных акций типа повторяя индекс, но там есть повышающие \ понижающие коэффициенты для отдельных акций, какие то акции с малой долей в индексе выкидываются, приведение к целевым весам через пополнение без продаж, что например не ограничивает долю Лукойла до 15% и т.д.
https://snowball-income.com/public/portfolios/UQqAIwzzQO
Как говорится сомнительно, но окей, можно представить, что человек не доверяет БПИФам или не хочет перебегать из фонда в фонд при повышением комиссии попадая при этом на налоги.
Но можно ли сделать еще проще? взять первые N акций из индекса (или не первые N, а как то умнее, те N которые лучше воспроизводят индекс, если это не тоже самое) и например если по какой то метрике они на 90% повторяют индекс, то сказать мне и так окей, так вот какую метрику тут нужно брать?
Поговорив с chatgpt он мне предложил по этому поводу коэффициент корреляции, бета коэффициент(рассчитывается в snowball https://snowball-income.com/public/portfolios/UQqAIwzzQO#scores ), коэффициент детерминации (R^2), что же используется на практике и имеет ли значение за какой интервал времени берется каждое значение в массиве (день, месяц, год)?
Если мы ограничиваемся только акциями из индекса имеет ли смысл вычислять что то типа MAE, MSE для массива из весов с которыми входят акции в портфель для сравнения?
Детально не копался в этом вопросе, готового ответа нет. Но я бы поискал про то, как индексные ETF подходят к этому вопросу - у них этот вопрос регулярно встает, как с помощью sampling следовать за индексом проще и эффективнее, чем с помощью полной репликации.
То есть, понятно, что смотрят на Tracking Error в том числе: https://www.investopedia.com/terms/t/trackingerror.asp
Но, может, есть какие-то еще соображения.