Стратегия торгов на основе риска (Risk-Based) для непрерывного двойного аукциона

» ГЛАВНАЯ > К содержанию номера
» Все публикации автора

Журнал научных публикаций
«Наука через призму времени»

Июнь, 2019 / Международный научный журнал
«Наука через призму времени» №6 (27) 2019

Автор: Воробьев Семен Анатольевич, Бакалавр
Рубрика: Технические науки
Название статьи: Стратегия торгов на основе риска (Risk-Based) для непрерывного двойного аукциона

Статья просмотрена: 361 раз
Дата публикации: 5.06.2019

УДК 004.942

СТРАТЕГИЯ ТОРГОВ НА ОСНОВЕ РИСКА (Risk - Based) ДЛЯ НЕПРЕРЫВНОГО ДВОЙНОГО АУКЦИОНА

Воробьев Семен Анатольевич

студент

Приходько Татьяна Александровна

доцента кафедры Вычислительных технологий

Кубанский государственный университет, г. Краснодар

Аннотация. В работе приводится описание стратегии поведения и управления агентами в мультиагентной системе [1], которая представляет собой площадку непрерывного двойного аукциона, где программный агент способен совершать: bid (покупку) или (ask) продажу. Стратегия заключается в том, что агент формирует ставку или запрос, оценивая степень риска и делая прогноз относительно конкурентного равновесия, которое может быть достигнуто на рынке.

Ключевые слова: мультиагентные системы, программный агент, аукцион, двойной аукцион.

Предпочтения торгового агента определяются его предельной ценой, которая является максимумом, который покупатель готов заплатить, и минимумом, который продавец согласится принять. Эти предпочтения затем включаются в торговую стратегию агента, которая определяет, как он реагирует на рыночные условия, с помощью заявок и запросов. Эта стратегия может быть ориентирована на риск, то есть трейдер пытается получить высокую прибыль (но имеет соответственно более низкую вероятность совершения сделки) или избегать риска, что обменивает (меньшую) прибыль на более высокую вероятность совершения сделки. Стратегия, нейтральная к риску, учитывает цену bid или ask, которая максимизирует ожидаемую прибыль. Стратегия RB гибка в том, что она может варьировать отношение к риску в зависимости от преобладающих рыночных условий, чтобы оставаться конкурентоспособным.

Более подробно, RB представлен двумя различными слоями [2]. Первый представляет поведение реагирующих ask, когда bid или ask подаются в соответствии с набором правил проведения торгов. Опишем эти правила.

Правила для продавца:

if ((oask - obid) ≤) accept obid

else if (limit price ≥ oask) submit no ask

else

if (нет информации) submit ask, используя уравнение 1

else

if (obid ≥ τ) accept obid

else submit ask, используя уравнение 1

Правила проведения торгов для покупателя:

if (oask - obid ≤ ) accept oask

else if (limit price ≤ obid) submit no bid

else

if (no information) submit bid, используя уравнение 2

else

if (obid ≤ τ) accept oask

else submit bid, используя уравнение 2

На эти правила влияет τ, целевая цена, произведенная моделью риска. Чтобы вычислить это значение, модель риска учитывает текущую оценку агентом цены КР, , которая предоставляется оценкой равновесия. Второй слой представляет адаптивное поведение, где трейдер обновляет свой фактор риска, когда инициируется рыночным событием (например, когда происходит транзакция или отправляется новый bid / ask). Это изменение заставляет агента быть более склонным к риску, если он может совершать сделки с более высокой прибылью или избегать риска, если он нацеливается на слишком высокую прибыль.

В начале периода у трейдера нет информации, кроме его предельной цены. Таким образом, покупатель i просто делает ставку в направлении минимума своей предельной цены, , и непогашенного спроса oask (см. Уравнение 1), чтобы максимизировать свой излишек. Аналогичным образом продавец j отправляет запрос на максимальную сумму своей себестоимости, и оставшейся bid, obid (см. Уравнение 2). Покупатель или продавец согласятся на сделку, когда его улучшение цены bid или ask (соответственно, по непогашенной цене bid или ask) находится в пределах абсолютного значения , которое мы устанавливаем в качестве минимальной неделимой единицы валюты (0,01).

(1)

(2)

где - константа, определяющая скорость снижения нормы прибыли. Низкое значение η означает более высокую скорость сходимости заявок или запросов к цене сделки, и, наоборот, высокое значение η предполагает более консервативный подход к проведению торгов и медленную конвергенцию.

Покупатель с низкой лимитной ценой должен сохранять свою рыночную власть, имея возможность делать ставки как можно дольше. В отличие от этого покупатель с высокой оценкой по сравнению с невыполненным запросом должен максимизировать свою прибыль, исследуя рынок и экспоненциально уменьшая разницу bid и ask. В любом случае поведение приводится в уравнениях 1 и 2. Однако если невыполненная bid (ask) выше (ниже) предельной цены покупателя (себестоимость продавца), трейдер не должен подавать bid (ask) до начала следующего раунда.

После первой транзакции трейдер обновляет свою оценку цены КР, которую он уточняет после каждой транзакции. Первоначально мы устанавливаем фактор риска трейдера r близко к 0 (придерживаясь нейтральной по отношению к риску позиции); −1 ≤ r <0 означает, что он не склонен к риску, а 0 < r ≤ 1, что он стремится к риску. Затем модель риска использует оценку цены КР и фактор риска для расчета новой целевой цены. Основываясь на последнем наборе и правилах торгов, трейдер подает bid или ask к целевой цене аналогично первому раунду.

Если целевая цена выше (ниже), чем непогашенная ask (bid) в любое время в процессе торгов, покупатель (продавец) принимает невыполненную ask (bid). Когда невыполненная ставка (ask) превышает (падает ниже) нашу целевую цену вместо того, чтобы не подавать дополнительную ставку (ask), мы перемещаем целевую цену (чтобы по-прежнему иметь возможность подать прибыльную bid или ask), используя механизм обучения, который мы опишем дальше.

На адаптивном уровне трейдер использует набор правил обучения, обобщенных ниже, чтобы обновить свой фактор риска, чтобы лучше соответствовать преобладающим рыночным условиям. В частности, алгоритм обучения используется для увеличения или уменьшения фактора риска.

Правила обучения для продавца:

if (transaction at q)

if (τ ≤ q) продавец должен увеличить свой фактор риска

else продавец должен уменьшить свой фактор риска

else if (ask a submitted)

if (τ ≥ a) продавец должен уменьшить свой фактор риска

Правила обучения для покупателя:

if (transaction at q)

if (τ ≥ q) покупатель должен увеличить свой фактор риска

else покупатель должен уменьшить свой фактор риска

else if (bid b submitted)

if (τ ≤ b) покупатель должен уменьшить свой фактор риска

Мы адаптируем отношение трейдера к риску, постепенно изменяя его фактор риска на желаемый фактор риска, δ (t), который зависит от (фактор риска, который соответствует последней bid, если агент является покупателем или последним ask, если продавец). Чтобы уменьшить свой фактор риска, трейдер устанавливает желаемый фактор риска немного ниже, чем (λ = -0,05), а когда трейдер увеличивает свой фактор риска, он устанавливает желаемый фактор риска немного выше, чем (λ = 0,05) при уменьшении фактора риска. Алгоритм вводит в действие процесс непрерывного обучения, который обратно проецирует ошибку между желаемым фактором риска δ (t) и текущим фактором риска r (t) на текущий фактор риска. λ выбирается подбором.

(3)

где - скорость обучения алгоритма и влияет на скорость движения целевой цены. Далее мы рассмотрим нашу модель риска, из которой мы определяем нашу целевую цену, τ.

Роль модели риска заключается в формировании целевой цены с учетом отношения риска трейдера, которое определяется его фактором риска. Целевая цена, равная предполагаемой цене КР, подразумевает, что трейдер рискует нейтрально. Когда трейдер выбирает подход, основанный на поиске риска, он рассматривает целевую цену, которая ниже СЕ (для покупателя) или выше СЕ (для продавца), чтобы получить более высокую прибыль. И наоборот, склонность к риску подразумевает, что трейдер нацеливает bids выше (ask ниже) КР, что повышает вероятность того, что его bid (ask) будет принята (но уменьшит свою прибыль). Теперь, поскольку КР не может быть известен априори в децентрализованной среде, нам нужно оценить цену КР на основе истории транзакций. Мы по-разному моделируем риск для разных типов агентов, поскольку они могут по-разному реагировать на рыночные условия. Обычно агенты могут быть двух типов; а именно внутри-маржинальные и экстра-маржинальные.

Покупатель (продавец) является внутри-маржинальным, если его предельная цена (себестоимость) выше (ниже), чем цена СЕ, и ожидается, что она совершит сделку на рынке. В отличие от этого, у экстра-маржинального покупателя слишком низкая оценка товара, в то время как у экстра-маржинального продавца слишком высокая стоимость, чтобы совершать сделки.

Сначала рассмотрим внутри-маржинального трейдера. Мы определили следующие ограничения, которым должна удовлетворять наша модель риска, учитывая различное отношение риска трейдера (например, когда покупатель полностью не склонен к риску, он нацеливается на ставку по своей предельной цене, тогда как, когда он полностью ищет риск, он нацеливается на ставку в 0). Следовательно, функция риска должна быть непрерывной и проходить через три указанных значения с коэффициентом риска -1, 0 и 1. Она также должна давать симметричное поведение для неприятия риска и поиска риска и, наконец, спрос должен быть в пределах произвольного максимума (MAX). Учитывая эти ограничения, существует бесконечное пространство решений для такой функции, и поэтому мы выбрали параметризованную функцию в пространстве решений, где θ определяет поведение функции (т. е. Скорость ее изменения по отношению к фактору риска). Когда θ велико, абсолютный градиент стремится к 0 в КР и увеличивается при стремлении θ к -1. Экспериментальные результаты показывают, что поведение стратегии назначения ставок зависит от значения θ. Функция накладывает ограничение на , чтобы ограничить максимальный абсолютный градиент и избежать чрезмерного обновления целевой цены в отношении изменения фактора риска.

Таким образом была рассмотрена модель стратегии торгов на основе риска. В данной стратегии используется метод скользящего среднего для оценки цены КР, , на основе истории транзакций. Это дает среднее значение за период времени, охватывающий последние транзакции. Кроме того, метод чувствителен к изменениям цены в течение короткого периода времени, но в течение более длительного промежутка времени, менее чувствителен. Скользящие средние обычно используются, чтобы подчеркнуть направление тренда и сгладить колебания цен, которые могут дезинформировать трейдера.

Список литературы:

Goldman C., Kraus S., and Shehory O., ‘On experimental equilibria strategies for selecting sellers and satisfying buyers’, Decision Support Systems Journal, (2003 (to appear)).
Vytelingum, P., Dash, R.K., David, E. and Jennings, N. R. (2004) A risk-based bidding strategy for continuous double auctions. 16th European Conference on Artificial Intelligence, 79-83, Spain.

Комментарии:

ПИ № ФС 77-69346

ISSN 2541-9250

Журнал научных публикаций
«Наука через призму времени»

Фамилия Имя Отчество:
Комментарий:

ПИ № ФС 77-69346

ISSN 2541-9250

Журнал научных публикаций«Наука через призму времени»

Журнал научных публикаций
«Наука через призму времени»