Тема: LCZero
Показать сообщение отдельно
Старый 22.05.2018, 18:50   #738
Maratka
Гроссмейстер
 
Аватар для Maratka
 
Регистрация: 11.04.2017
Адрес: РФ, Крым, Севастополь.
Сообщений: 2,374
Сказал(а) спасибо: 515
Поблагодарили 1,938 раз(а) в 1,291 сообщениях
Репутация: 64
По умолчанию Re: LCZero

Не совсем так.
По сути, "случайные" ходы мы имеем только при наигрывании первой сети, т.е. первых нескольких тысяч партий.
Сеть №2 играет уже исходя из имеющихся данных в первой сети: случайно сделав хороший ход, мы выигрываем партию, и таким образом ставим более высокую оценку этому ходу, и более низкую - ходу в этой же позиции в предыдущей версии сети. Следовательно, в дальнейшем лучший ход будет в этой позиции сделан с заметно бОльшей вероятностью.

Проблема возникает именно при переучивании сети, заполненной ходами с неверными их весами: сделав даже 1000 правильных ходов в некой позиции, мы лишь слегка поднимем их вероятность, т.к. у ошибочных ходов уже есть очень высокий рейтинг в сети, а значит их вероятность все равно очень высока.
Maratka вне форума   Ответить с цитированием