PDA

Просмотр полной версии : LCZero


Страницы : 1 2 3 4 5 [6] 7 8

svoitsl
18.09.2018, 13:35
Обучали.
ну возможно не заметил, помнится там обучали не тестовую сеть летом, а потом перестали и почти месяц ничего не обучали.
сеть 10312 это сеть тест10 - синие ромбики
сейчас на http://lczero.org/ обучается тест20 (сети 20ххх) - это красные квадратики
а тест30 на картинке выше нет совсем
Я вижу что там написано. ;)
вы уверены?

Maratka
18.09.2018, 15:20
Т.е. новая сеть обучается медленнее.
А как прямо сравнение - две сети с равным Elo в селфплей друг против друга?

svoitsl
18.09.2018, 16:35
Т.е. новая сеть обучается медленнее.
почему то считается что тише едешь-дальше будешь, то есть обучается медленно и долго (до 80 млн игр) но обучится чуть лучше

svoitsl
18.09.2018, 18:42
долго (до 80 млн игр)
с такими темпами
124 users in the last day have played 343750 games
это будет дольше , чем предполагалось

Rom77
21.09.2018, 08:58
Свежие данные по скорости Лилы на новых видеокартах NVidia. Скорость на уровне профессиональных Tesla V100 и Titan V:

with cudnn 7.3 and 411.63 driver available at nvidia.com
minibatch-size=512, network id: 11250, go nodes 1000000

fp32 fp16
Titan V: 13295 29379
RTX 2080: 9708 26678
RTX 2080Ti: 12208 32472
Cкрины прилагаю. Если я правильно понимаю, автор сообщения является одним из разработчиков Лилы и кроме того писал дрова для некоторых видеокарт NVidia.

Для цены 1000$ за карту скорость очень даже неплохая. Технические подробности по архитектуре в NVIDIA-Turing-Architecture-Whitepaper.pdf (https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/technologies/turing-architecture/NVIDIA-Turing-Architecture-Whitepaper.pdf) (6 Мб). У RTX 2070, судя по всему, будет половинная скорость и половинная цена.

Maratka
21.09.2018, 22:25
Скорость на уровне профессиональных Tesla V100 и Titan V:

Titan V не профессиональная плата. Безусловно быстрая, но без ECC-памяти для серьезных расчетов ее использовать невозможно.
http://www.hardwareluxx.ru/index.php/news/hardware/grafikkarten/44367-nvidia-titan-v-.pdf

Естественно, что все 20xx платы также с ECC не дружат.

svoitsl
22.09.2018, 10:34
вот есть такой вопрос!
Если игры тест20 правильные, то почему они не используются для тест30 например.
Зачем каждый раз генерировать новые?
(если есть 20 млн хороших старых)
Нельзя же сказать что всякие LR и прочие параметры пагубно влияют на качество игр, делая их плохими?

Maratka
22.09.2018, 12:17
Все эти игры сгенерированы с неверными правилами.

svoitsl
22.09.2018, 13:20
Ошибок в генерации игр вроде пока не обнаружено, а что качается правил, то вроде ещё не известно какие верные и неужели их нельзя определить обучая сети поменьше?

svoitsl
25.09.2018, 18:38
Вышел
Lc0 v0.18.0-rc (https://blog.lczero.org/)
довольно много изменений


KNOWN BUG!

We have credible reports that in some rare cases Lc0 crashes!
However, we were not able to reproduce it reliably. If you see the crash, please report to devs! What seems to increase crash probability:
Very short move time (milliseconds)
Proximity to a checkmate (happens 1-3 moves before the checkmate)

New features:

Endgame tablebases support! Both WDL and DTZ now.

Added MultiPv support.

Time management changes:

Introduced --immediate-time-use flag. Yes, yet another time management flag. Posible values are between 0.0 and 1.0. Setting it closer to 1.0 makes Leela use time saved from futile search aversion earlier.

Some time management parameters were changed:
Slowmover is 1.0 now (was 2.4)
Immediate-time-use is 0.6 now (didn't exist before, so was 0.0)

Fixed a bug, because of which futile search aversion tolerance was incorrectly applied, which resulted in instamoves.

Now search stops immediately when it runs out of budgeted time.
Should help against timeouts, especially on slow backends (e.g. BLAS).

Move overhead now is a fixed time, doesn't depend on number of remaining moves.

Other:

Out of order eval is on by default. That brings slight nps improvement.

Default FPU reduction is 1.2 now (was 0.9)

Cudnn backend now has max_batch parameter.
(can be set for example like this --backend-opts=max_batch=100).
This is needed for lower end GPUs that didn't have enough VRAM for a buffer of size 1024. Make sure that this setting is not lower than --minibatch-size.

Small memory usage optimizations.

Engine name in UCI response is shorter now. Fritz chess UI should be able
to work with Leela now

Added flag --temp-visit-offset, will allow to offset temperature during training.

Command line and UCI parameter values are now checked for validity.

You can now build for older processors that don't support the popcnt instruction by passing -Dpopcnt=false to meson when building.

32-bit build is possible now. CPU only and we were only able to build it in Linux for now, including Raspberry Pi.

Threading issue which caused crash in heavily multithreaded environment with slow backends was fixed.

Maratka
25.09.2018, 18:59
>>Time management is optimized. Leela should take more time in first half of the game now, and insta-move rarer.

Ну и зачем, если LZ и так отлично играет дебюты и мительшпиль, и сливается обычно в эндшпиле, не в последнюю очередь потому, что не успевает просчитать варианты?

svoitsl
26.09.2018, 20:14
Интересная ситуация (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=372797817), за 200 сетей, с 20660 до 20860, Лила не то что не поумнела не насколько, а даже поглупела весьма, на величину значительно превышающую точность определения её ума

Vizvezdenec
26.09.2018, 21:20
Не вижу там величины, значительно превышающей.
2961 это 20660
2936 это 20840
Погрешность каждого рейтинга 40 эло...

svoitsl
26.09.2018, 22:13
Не вижу там величины, значительно превышающей.
я правда смотрел 20860, а у неё рейтинг 2827, разница с сетью 20660 уже 134 Эло

Vizvezdenec
26.09.2018, 22:36
Ну этот рейтинг весьма корявый, я уже несколько раз говорил, по какой причине :) Возможно, что между 40 и 60 версией что-то поменяли и идёт временное его падение.

svoitsl
26.09.2018, 23:40
Возможно, что между 40 и 60 версией что-то поменяли
Что то (а точнее снизить LR) собираются сделать только после 30 и 50 млн игр (сейчас только 22 млн), то есть примерно через 3-4 недели, а потом ещё через 3 недели (если быть оптимистом), а полностью тренировка завершится примерно на 80 млн, то есть как раз в 1-ому году Лилы.:)

svoitsl
27.09.2018, 09:45
А вот и Lc0 v0.18.0-rc2 (http://blog.lczero.org/2018/09/lc0-v0180-rc2-has-been-released.html)
мелкие неточности
•Fixed a severe race condition bug when only happened when --out-of-order-eval is on (which is the default value now).
Could produce incorrect search results.

Maratka
27.09.2018, 12:32
А вот и Lc0 v0.18.0-rc2
мелкие неточности

Could produce incorrect search results.
Это не мелкая неточность, это +3 =8 -0 в пользу SF в моем матче движков (оба без книг, LZ с сетью 11250

Maratka
27.09.2018, 17:55
Что то (а точнее снизить LR) собираются сделать только после 30 и 50 млн игр (сейчас только 22 млн), то есть примерно через 3-4 недели, а потом ещё через 3 недели (если быть оптимистом), а полностью тренировка завершится примерно на 80 млн, то есть как раз в 1-ому году Лилы.

Честно говоря, новые сети у меня вообще вдохновения не вызывают. Потенциально - хороши, ибо обучены на партиях без ошибок, но реализация... гм.. После обучения на равном количестве партий новая сеть отстает от старой на вполне приличную сотню Elo.
С другой стороны, старой сети, дабы войти в тройку (Komodo, Houdini, LZ) не хватает какого-то мизера, буквально 50 Elo. И за несколько месяцев их можно было бы попытаться таки набрать.
Во всяком случае, финал SF vs Hoidini мы видели в марте, повторять его против новой версии SF - нет никакого практического интереса: и результат известен, и для теории дебютов пользы никакой. Аналогично матч против Komodo. А вот финал SF vs LZ был бы весьма полезен с практической точки зрения, уж хотя бы для пополнения дебютных справочников, ибо LZ - монстр мительшпиля.

svoitsl
27.09.2018, 18:20
И за несколько месяцев их можно было бы попытаться таки набрать.
Это, увы, маловероятно, при снижении LR прирост тоже снижается, по подсчетам можно было бы набрать ещё 20-25 Эло

Во всяком случае, финал SF vs Hoidini мы видели в марте
Ну может финал будет ещё с Комодо, это до конца ещё не известно
К тому же Комодо ещё обновиться , прибавив 10 Эло, вот и интерес будет

sovaz1997
27.09.2018, 18:40
Komodo не получал ЭЛО с версии 11.2.2. Не думаю, что что-то изменится. А для того, чтобы составить хоть какую-то конкуренцию, надо как минимум 50 пунктов набрать.

Maratka
27.09.2018, 20:54
Это, увы, маловероятно, при снижении LR прирост тоже снижается, по подсчетам можно было бы набрать ещё 20-25 Эло
Этого достаточно, чтобы сравняться с Houdini и Komodo при игре в бесконечно большом отборе. Хватит ли этого на практике в следующем TCEC - увидим через три месяца.

В любом случае, очевидно, что LZ зайдет в премьер-дивизион, и зайдет крепко, вытеснив кого-то из первой четверки (очевидно, что кандидат №1 - Fire)

Maratka
27.09.2018, 21:00
Komodo не получал ЭЛО с версии 11.2.2. Не думаю, что что-то изменится. А для того, чтобы составить хоть какую-то конкуренцию, надо как минимум 50 пунктов набрать.

Мало партий. Усиления не может не быть, другое дело, что оно измеряется единицами Elo, т.е сыграв сотню партий его засечь очевидно невозможно.

sovaz1997
27.09.2018, 21:14
Если бы партий мало, я бы не говорил. Но их больше 3000 :)
http://www.ipmanchess.yolasite.com/i9-7980xe.php

В итоге с погрешностью в 4 пункта Komodo 2123.00 слабее, чем Komodo 11.3.1 на 2 пункта

Maratka
27.09.2018, 22:40
У меня есть стойкое понимание, что LZ неправильно (не до конца правильно) использует базы syzygy
Позиций воз и тележка, даже не пытаюсь их показать, просто для информации - когда SF уже два-пять десятков ходов рисует нули, LZ кажет, что у него +1 +2, а то и +5
При этом к таблицам LZ обращается (хотя и на 2-3 порядка реже, чем SF).

Варианты понимая ситуации (инфа для crem).
1) Количество попаданий в таблица слишком мало для их учета (тысячи против миллионов). Соответственно ловить рыбку негде, ибо... ну нет ее, этой рыбки, т.к. фантастически разный потакатель TB hit.
2) Корявая, а может быть и хуже: грубо неправильная обработка данных с таблиц.



_________
тем не менее, если crem или кого еще из команды LZ заинтересуют позиции - я имею что показать. Все что нужно - спросить.

______
p.s
Используются полные шестифигурки с частю семифигурок.

Maratka
27.09.2018, 22:44
Если бы партий мало, я бы не говорил. Но их больше 3000
А нужно на порядок больше, если есть желание словить разницу около 10 Elo
Если нужно ловить разницу в единицы Elo - то на два порядка больше.

________
Итого: недостаточно партий. Повторяюсь, но повторение - суть учения :)

sovaz1997
27.09.2018, 22:50
Это да, но почти точно эта версия не сильнее, чем 11-я. Конечно, реальную разницу увидеть трудно, но +-4 - это достаточно точно. Я думаю, что они сейчас рефакторинг ом занимаются. Может, скоро и пункты пойдут))

Alex_Lk
28.09.2018, 13:21
Кто нибудь использует LCZero для анализа своих партий. Если да, поделитесь впечатлениями.

Maratka
28.09.2018, 13:47
Так его буквально только позавчера стало возможным использовать.
До этого у движка не было возможности анализа в несколько линий.

Viktor
28.09.2018, 17:35
Попробовал в Аквариуме установить. Долго грузился, но в песочнице не запускается...

Viktor
29.09.2018, 09:11
Можно указать инструкцию по подключению и использованию движка в Аквариуме?

Maratka
29.09.2018, 09:53
Да по идее, как любой UCI-двиг.
Одна особенность: LZ нужна база партий (сеть), которую нужно положить в тот же каталог, что и сам движок.

Rom77
29.09.2018, 09:53
Можно указать инструкцию по подключению и использованию движка в Аквариуме?
У вас какая видеокарта?

Viktor
29.09.2018, 13:51
У вас какая видеокарта?

Видеоадаптер GeForce GT 240

Maratka
29.09.2018, 13:55
Тогда похоже упс...
Запустится только CPU-версия, но она исключительно медленная, и смысла в ней - только ради совместимости.

Rom77
29.09.2018, 14:26
Видеоадаптер GeForce GT 240
Да, толку от видеокарты не будет. Запускать Лилу придется на центральном процессоре, а это очень медленно. Для анализа, естественно, непригодно.

===============================
Не знаю, пробовали ли вы устанавливать Лилу ранее, поэтому пока просто базовые вещи:

- Нужно скачать последнюю версию Лилы для CPU отсюда:
https://github.com/LeelaChessZero/lc0/releases, версия называется lc0-v0.18.0-rc2-windows-blas.zip (https://github.com/LeelaChessZero/lc0/releases/download/v0.18.0-rc2/lc0-v0.18.0-rc2-windows-blas.zip)

- Скачать одну из протренированных нейросеток отсюда:
http://testserver.lczero.org/networks/
Не все из них протренированы, так что рекомендую просто скачать сеть 11250 (http://testserver.lczero.org/get_network?sha=093eb742d27cb725825ed4ec213a9a21a5 6c9a316c2a4773b116f54a4118ed06)

- Распаковываете архив программы в отдельную папку и копируете туда файл с нейросетью.

- Далее просто устанавливаете как обычный движок UCI.

Maratka
29.09.2018, 15:06
Viktor, из копеечных вариантов, но так чтобы более-менее работало- берите GT 1030.
Подороже, но с вполне приемлемой производительностью как для шахмат, так и для просто "поиграться", ну или там видео быстренько конвертнуть для смартфона - GTX 1050 Ti.
Ну и если совсем денег много - что-то из новых RTX'ов.
Все варианты выше - если настольный ПК. Если ноутбук - очевидно, что менять целиком.

Viktor
29.09.2018, 16:04
Viktor, из копеечных вариантов, но так чтобы более-менее работало- берите GT 1030.
Подороже, но с вполне приемлемой производительностью как для шахмат, так и для просто "поиграться", ну или там видео быстренько конвертнуть для смартфона - GTX 1050 Ti.
Ну и если совсем денег много - что-то из новых RTX'ов.
Все варианты выше - если настольный ПК. Если ноутбук - очевидно, что менять целиком.

Спасибо за информацию. Когда собирали комп, то на видео экономили (тогда не было таких движков).
А как выглядит GeForce GTX 750 Ti ?

Maratka
29.09.2018, 16:24
Математика чуть быстрее, чем 1030, но у нее мало памяти, текущие сети в нее не впихнутся.
Чисто для оценки соотношения вычислительной мощности, можете глянуть данные тут:
http://browser.geekbench.com/opencl-benchmarks

Учитывайте, что для GeForce CUDA версия движка будет раза в два быстрее чем OpenCL, тогда как в случае Radeon OpenCL - единственный вариант.
И да, касательно памяти: минимум два гигабайта, в них внатяг помешаются текущие сети. Но если размерность увеличат - 4 гигабайта будет минимумом.

Maratka
30.09.2018, 10:39
Никто не обращал внимания, что у LZ на оценку позиции слабо влияет использование таблиц Syzygy?

Ну например тут:
http://www.imageup.ru/img222/thumb/lz3179965.jpg (http://www.imageup.ru/img222/3179965/lz.jpg.html)

К разработчикам: LZ неправильно их использует, не использует вовсе, или просто мало попаданий? Если последнее - сильно больше их и не бывает, а значит - зачем они нужны?

Vizvezdenec
30.09.2018, 13:55
Она хотя бы выигрывает 6-фигурные табличные победы, без таблиц - нет :)
Но да, эффект далеко не такой сильный, как раньше считалось. Не считает она настолько глубоко, чтобы реально получать профит от таблиц, когда фигур много на доске.

Maratka
30.09.2018, 14:27
Она хотя бы выигрывает 6-фигурные табличные победы, без таблиц - нет
Проблема в том, что именно тут таблиц Syzygy не нужно. ;)
Вполне достаточно старых-добрых таблиц Налимова. Более того, даже предпочтительнее, движки в этом случае отключаются, и все доигрывание делает оболочка, абсолютно точно и безошибочно.

svoitsl
30.09.2018, 16:00
Видимо Lc0 играет так как и задумали разрабочики,
её зерелизили (http://blog.lczero.org/2018/09/lc0-v0180-has-been-released.html)

There is a small known issue with time management. The version v0.18.0 times out sometimes when all of the following is true:

Ponder is ON
Time is added every X moves (e.g. every 40)
There is per move increment

Но версия 0.18.1. тоже возможна....когда нибудь, когда ещё какие нибудь ошибки найдут и пофиксят

svoitsl
30.09.2018, 22:44
Все таки было бы интересно узнать...
Если параметр LR так важен (настолько важен, что он него зависит правильность игр), то нельзя ли его например менять динамически?
Поставить в зависимость LR и количество игр (шагов)
То есть менять его не 3 раза за все время сразу на порядок, а например уменьшать в 1.5 раза каждые 1-2 млн игр (или как то так)?

Artem16
01.10.2018, 18:50
Здравствуйте у меня вопрос как подключить видеокарту так же как процессор

Artem16
01.10.2018, 18:54
Вы писали базовые настройки для cpu сеть 11250 а как видеокарту подключить у меня GTX 1050 Ti

svoitsl
01.10.2018, 18:54
как подключить видеокарту так же как процессор
Вопрос не совсем понятен, боюсь что "как процессор" вы видеокарту вряд ли подключите, если у вас не какое то специальное железо.
У меня например процессор вставляется в один разъем (типа 1151 кажется), а вот видеокарта совсем в другой - в PCI-E
Вроде бы GTX 1050 вставляется как раз в разъем PCI-E, может ей потребуется дополнительное питание (6 или 8 контактный разъем от блока питания надо подключить к видеокарте)
Ещё видеокарта может занимать целых два разъема, значит соседний лучше освободить
Что касается настроек то можно попробовать и без них, скачайте cuda (https://github.com/LeelaChessZero/lc0/releases/tag/v0.18.0) версию, там есть все нужные файлы
(ну и файл сети (http://lczero.org/get_network?sha=093eb742d27cb725825ed4ec213a9a21a5 6c9a316c2a4773b116f54a4118ed06) тоже конечно не забудьте рядышком положить)

Artem16
01.10.2018, 19:04
ну вот так Не знаю, пробовали ли вы устанавливать Лилу ранее, поэтому пока просто базовые вещи:

- Нужно скачать последнюю версию Лилы для CPU отсюда:
https://github.com/LeelaChessZero/lc0/releases, версия называется lc0-v0.18.0-rc2-windows-blas.zip

- Скачать одну из протренированных нейросеток отсюда:
http://testserver.lczero.org/networks/
Не все из них протренированы, так что рекомендую просто скачать сеть 11250

- Распаковываете архив программы в отдельную папку и копируете туда файл с нейросетью.

- Далее просто устанавливаете как обычный движок UCI.А вопрос как подключить GPU

svoitsl
01.10.2018, 19:08
Нужно скачать последнюю версию Лилы для CPU отсюда:
для GPU скачивайте cuda версию
остальное без изменений
lc0 для cuda найдёт сама ваш GTX 1050

Artem16
01.10.2018, 19:21
Спасибо !!! то ко не понятно нейросеть 11250 два раза скачивать для cpu и gpu а открыть в оболочке lc0 для cpu как обычный движок uci

svoitsl
01.10.2018, 19:39
лучше для CPU и GPU создать две разные папки и в каждую записать файл сети (если место позволяет, если не позволяет то можно указать место расположения файла сети в настройках uci движка для оболочки, или может и самого движка тоже), скачать можно и один раз, а потом просто скопировать в нужную папку

Maratka
04.10.2018, 15:16
К разработчикам:
Просьба исправить вывод имени движка при анализе позиии в оболочках ChessBase (насчет других оболочек - не в курсе):

http://www.imageup.ru/img154/3183296/qqq.png (http://www.imageup.ru/img154/3183296/qqq.png.html)

svoitsl
06.10.2018, 09:29
Если глянуть тут (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=372797817)
то получится, что новая сеть 21100 имеет ровно на 117 Эло меньшей рейтинг чем старая 20660 (при точности +/-40 Эло)
А ведь между ними не мало -не много, а почти 8 млн игр, которые, кажется, ничему сеть не научили, она даже поглупела более чем на полуровня
Интересно,а с точки зрения теории как нибудь обоснована идея, что если скорость роста сети ниже вначале, то потом она увеличиться до такой , что Эло станет выше?
В настоящее время на этом построено обучение, считается что низкая скорость сохраниться большее время.

Maratka
11.10.2018, 13:06
За последние сутки рейтинг селфплей вырос на ~200 ELO.
Есть данные по изменению реального рейтинга?

Rom77
11.10.2018, 13:40
За последние сутки рейтинг селфплей вырос на ~200 ELO.
Есть данные по изменению реального рейтинга?
Смотрим как обычно здесь (https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729) и здесь (https://docs.google.com/spreadsheets/d/18UWR4FVhPi0vNwwPreu_avd9ycujGQ5ayR2LzJOWP4s/edit#).

Maratka
11.10.2018, 14:15
Нет там данных еще по новым сетям...

Maratka
11.10.2018, 14:18
К тому же тут (https://docs.google.com/spreadsheets/d/18UWR4FVhPi0vNwwPreu_avd9ycujGQ5ayR2LzJOWP4s/edit#gid=0) была замена железа:
-GPU GTX 1060 was replaced with a faster RTX 2080 Ti starting from LC0_Id21268.

Т.е. сопоставить результаты сетей ID10xxx и последних сетей ID20xxx за последние дня три уже невозможно.

Vizvezdenec
11.10.2018, 15:23
Leela 21358 3116
Вот это же новая сеть? В первом листе она есть.

Maratka
11.10.2018, 15:26
Где же она новая, если она была за пол-дня, может и сутки до роста сети?
См. график
http://lczero.org/

Vizvezdenec
11.10.2018, 15:39
Ну хотя бы из нового поколения :)

Алексей
13.10.2018, 18:49
Ну хотя бы из нового поколения :)
Скоро похоже будет новый рост)

svoitsl
13.10.2018, 20:27
Скоро похоже будет новый рост)
если учитывать, что число игр сократилось в 10 раз, то может и не скоро

Виндхук
13.10.2018, 22:20
если учитывать, что число игр сократилось в 10 раз, то может и не скоро
Там просто на время отрубали обучение.

Kesandr
19.10.2018, 11:49
Да что то лила сейчас опять грохнулась вниз с 4649 до 4388 ело на графике. Что случилось что последние сети пошли вниз? Опять поменяли какие то параметри?

svoitsl
20.10.2018, 00:04
грохнулась вниз с 4649 до 4388 ело на графике
и это ещё не предел, сейчас уже 4363.7, это они так LR понизили

Vizvezdenec
20.10.2018, 01:21
Хватит уже смотреть на этот график, он не имеет (и не имел) особого смысла никогда.
Лучше мониторить прогресс по рейтинг-листам против других движков, чем по нему.

svoitsl
20.10.2018, 08:46
Хватит уже смотреть на этот график
Конечно, на него можно и не смотреть,но от факта того, что 6 млн игр (от id21500 до 21700) так и не позволили Эло выйти за стат погрешность (+/-40Эло) при том, что снизили LR совсем недавно, тоже не уйти

Алексей
20.10.2018, 18:59
вот тут (http://lczero.org/training_run/2)
Только что пошел вверх)

Bullet
22.10.2018, 05:32
Program Elo + - Games Score Av.Op. Draws

1 lc0_21735 : 3123 61 60 98 56.6 % 3077 25.5 %
2 lc0_21584 : 3077 60 61 98 43.4 % 3123 25.5 %

Individual statistics:

1 lc0_21735 : 3123 98 (+ 43,= 25,- 30), 56.6 %

lc0_21584 : 98 (+ 43,= 25,- 30), 56.6 %

2 lc0_21584 : 3077 98 (+ 30,= 25,- 43), 43.4 %

lc0_21735 : 98 (+ 30,= 25,- 43), 43.4 %

100 nodes per move

svoitsl
22.10.2018, 23:47
Последние 3 млн игр (от id 21700 до 21800) особого ума к сожалению не дали (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=372797817), но и падения реального рейтинга тоже нет, что видимо, хорошо
В целом последние 9.5 млн игр не вывели рейтинг за стат. погрешность.
Темпы обучения сократились за последние дни с 1.6 до 1.1 млн игр в сутки, то есть почти в 1.5 раза

svoitsl
23.10.2018, 23:33
Если считать, что очередное (возможно последнее) снижение LR ожидалось после 50 млн, а на деле скорее всего будет после 55 млн, то ,учитывая что 48 млн уже есть, то остается всего 7 млн, что может быть достигнуто уже к концу этой недели .
Значит где то 28-29 октября может быть очередное снижение LR и возможно хоть какой то рост Эло. После этого тренировка будет продолжена, как предполагалось ранее до 60 млн игр, но я не удивлюсь что и до 70 млн.
И уже к середине ноября вполне может быть завершено.
Интересно, что же будет в итоге?

Maratka
24.10.2018, 00:03
Поживем, увидим, но мне кажется, что ничего особого не будет.
А вот предыдущую версию сети накрутить еще на 50 ELO за три месяца думаю было бы реально. Тогда бы появился конкурент для SF в финале очередных турниров (естественно не домашних, где против шестиядерного процессора играет GTX 1070, хотя по соотношению мощностей там место 1060 3G, а то и 1050 Ti, а достаточно профессиональных).
Во всяком случае, +50 ELO на старой версии сети за три месяца мне представляется куда как более вероятным событием, чем ~300 ELO на новой за месяц.

svoitsl
26.10.2018, 18:34
Ну что ж, уже есть новые (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=372797817) результаты тестирования новых сетей
id21850 , id21900
для обучения id21900 потребовалось 116-67=49 млн игр
и она поумнела до 3142 Эло, то есть не последние 400 сетей, не 116-103= 13 млн игр не позволили выйти за стат. погрешность относительно сети id21500 (3108 Эло)
Но очень скоро будет взрыв силы игры, ведь сети надо набрать хотя бы 3550-3142=408 Эло!!!
Для этого у неё есть ещё 20 млн игр и одно снижение LR

svoitsl
30.10.2018, 11:03
очень много букв Lc0 training (http://blog.lczero.org/2018/10/lc0-training.html#more)
Может кто нибудь и поймет....

Kesandr
07.11.2018, 13:56
А куда из сайта лсо пропали графики тренировки предидущих сетей? Сейчас идет тренировка вижу сети 30 котороя наиграла 10 милионнов игр. А где те которие наиграли более ста милионнов игр?

Vizvezdenec
07.11.2018, 14:29
сеть 20 умерла.
Вполне официально, сейчас основная сеть это 30.

Kesandr
07.11.2018, 18:13
В каком смисле умерла? Не видно было путей дальнейшего усиления сети или что то другое случилось? А Более ста двадцати милионов игр и тренировочних данних могут использоваться с пользой каким то образом 30 той сетью?

svoitsl
07.11.2018, 18:47
Такое впечатление. что 20 тест решили не доигрывать до конца, непонятно только почему, ведь планировался скорый рост на целых 350 Эло или даже выше за следующие 10 млн игр.

Vizvezdenec
07.11.2018, 18:52
ну рост может быть и планировался, но его никто в реальности не видел, я так понимаю.
В итоге плато получилось аж на 3 сотни эло ниже 10 серии.

Magystr
07.11.2018, 22:35
Исходя из большого роста 30-й сети, было сделано предположение, что она скоро обгонит 20-ю и продолжит свой рост. Поэтому 30-ю объявили основной. Но 20-ю пока не бросили совсем, просто перераспределили ресурсы и отображение.

Maratka
09.11.2018, 02:20
https://github.com/LeelaChessZero/lc0/releases/tag/v0.19.0-rc2

Kesandr
09.11.2018, 13:17
Прошел матч на сервере тсес между старой и новой сетью с контролем времени 15+2 И вот старая сеть винесла в одни ворота новую без единого поражения. LCZero v19-11248 - LCZero v19-30999 +8-0=12. https://tcec.chessdom.com/live.html Плохо что партий нет интересно посмотреть что же там такое творилось?

svoitsl
09.11.2018, 23:13
И вот старая сеть винесла в одни ворота новую без единого поражения.
странное соревнование, на мой взгляд надо сравнивать сети полученные после примерно одинакового числа обучающих игр, а тут шулерство какое то

Maratka
10.11.2018, 00:53
Наоборот замечательное сравнение: в равных условиях на достаточно мощном железе сравнили сети, и получили что получили.
Ничуть не буду против того, чтобы опыт повторили еще разок через месяц. Это лучше дутых ELO, которые видны по selfplay, а сравнения с другими движками на сайте LZ как-то не очень понятно оформлено: мелкая таблица, все сливатется, нет партий, короче ужас кошмарный.

svoitsl
10.11.2018, 10:23
Наоборот замечательное сравнение:
а что собственно тут собираются сравнить?
Если методику обучения (лучше она стала или хуже) то и надо сравнивать последнюю сеть 30 с сетью 10 обученную на таком же количестве игр, и сразу станет ясно лучше новая сеть или хуже.
И то что 20 сеть решили забросить, следует ли , что идея о более ускоренном обучении в конце этого обучения оказалась ложной?
То есть отставание в темпах обучения сети 20 объяснялось новой продвинутой стратегией, предполагающей увеличение роста впоследствии

Maratka
10.11.2018, 12:45
а что собственно тут собираются сравнить?
Результат.

svoitsl
10.11.2018, 21:50
Результат.
результат пока довольно печален (https://groups.google.com/forum/#!topic/lczero/Qo3gb2foJKA)
И на TCEC 14 придется играть старой 10 сетью
(даже 30 сеть вряд ли до конца года станет достаточно сильной, учитывая падение числа игр в сутки )

sovaz1997
10.11.2018, 22:14
Пока рост идёт: http://lczero.org

Всё-таки, думаю, хоть немного, но 30-я сеть должна с большой вероятностью обогнать старую в этом году. Посмотрим)

Maratka
10.11.2018, 23:31
Пока рост идё
SelfPlay растет. Как это соотносится с реальным рейтингом? Да по сути почти никак.

Vizvezdenec
10.11.2018, 23:42
Ну, собственно, ожидалось, что и 20 сеть-то будет ого-го, а на деле имеем то, что имеем. Оптимизма по поводу 30 сети особого это всё не вселяет, конечно.

sovaz1997
11.11.2018, 00:29
SelfPlay растет. Как это соотносится с реальным рейтингом? Да по сути почти никак.
Всё-таки, при больших изменениях в self-play видны изменения в реальности.

Раньше говорили, что и до уровня Ethereal не дойдет. Посмотрим, в общем. AB-движки далеко не идеальны, просто они уже очень давно развиваются.

Maratka
11.11.2018, 13:13
Всё-таки, при больших изменениях в self-play видны изменения в реальности.
Понятно, что за месяц при обучении с нуля видно. Проблема с "дальше".

_____
Выше я уже писал:
Поживем, увидим, но мне кажется, что ничего особого не будет.
А вот предыдущую версию сети накрутить еще на 50 ELO за три месяца думаю было бы реально. Тогда бы появился конкурент для SF в финале очередных турниров

Короче говоря, 10-й сети не хватает самой малости, чтобы претендовать на корону.
А сетям 20 и 30 еще учиться и учиться. И неизвестно, что в итого будет, ибо как я понял, учат их как-то иначе.

Maratka
11.11.2018, 13:31
Вон они сами пишут кстати, на своей странице с графиком обучения, что:

"As our previous 'run to completion' has not made much progress recently, main page and default contributions have been reset to our new actually testing run while we wait for lc0 0.20.0 to be prepared with a new network architecture for our next main run."

Т.е. ничего нового до версии 0.20 не ожидается. Потом сеть начнет учиться по иному. Возможно, это даст резкий прирост. А возможно, выйдет пшик.

svoitsl
11.11.2018, 15:05
Короче говоря, 10-й сети не хватает самой малости, чтобы претендовать на корону.
Ну насчет короны это вряд ли, там надо около 50 Эло, даже на монстроидальном железе, а вот приблизиться к TOP 3 на TCEС 14 вполне можно, доучив сеть ещё 5 млн играми снизив LR и набрав ещё 20-25 Эло
А если бы удалось бы ещё и на эндшпилях обучить, то и действительно до короны было бы рукой подать.

Т.е. ничего нового до версии 0.20 не ожидается
Неизвестно, что там собираются добавить или исправить, но получается, что более менее зрелая LC0 будет как раз к первому году своего рождения (к началу марта 2019 г). И то, если ещё будет кому к тому времени совершенствовать код и обучать.
(за 8 мес число обучающих сократилось в 3 раза)

Maratka
11.11.2018, 15:25
Ну насчет короны это вряд ли, там надо около 50 Эло, даже на монстроидальном железе,
Новое железо (RTX'ы вместо 1080 Ti) само по себе вполне может дать несколько десятков ELO, итого получается, что до реальных претензий на корону не хватало вообще пшик. За три месяца, пока учили другие сети, забросив сеть 10xxx, эти копейки абсолютно уверен набрать вполне было можно. Но решили не гоняться за "копейками", а сразу набрать плюс несколько сотен ELO сверх предыдущей сети. Не вышло, так бывает. Курочка по зернышку клюет, про этот принцип забыли. Возможно, сделано то что сделано вполне оправдано, и теперь уже сеть 30xxx сможет превзойти на несколько сотен ELO сеть 10xxx, но лично мне было бы куда как приятнее иметь синицу в руках. А потом, имея корону, гоняться за журавлем - пожалуйста, сколько угодно.

svoitsl
11.11.2018, 21:09
А между тем вышел RC3 (https://github.com/LeelaChessZero/lc0/releases)

Changelog

Fix OpenCL tuner always loading the first saved tuning (#491)
Do not show warning when ComputeBlocking() takes too much time. (#494)
Output microseconds in log rather than milliseconds. (#495)
Add benchmark features (#483)
Fix EncodePositionForNN test failure (#490)

И вполне возможно, что на следующей неделе будет уже релиз
А LC0 с полноценной поддержкой TB на TCEC 14 вполне может выступить более достойно, так как именно в эндшпилях LC0 немного не дотягивает...
Да и время доучить тоже ещё есть....

Новое железо (RTX'ы вместо 1080 Ti)
Так вроде на турнире и не было 1080i
(было что то посерьезнее кажется)

Vizvezdenec
11.11.2018, 21:57
TB не дают Лиле больше эло, чем АльфаБета движкам - слишком уж она редко до этих самых таблиц вообще доходит.
Вот использование их в обучении - это дело, а просто поддержка TB... Ну вот на 4с играет Лила с таблицами, толку-то чуть, всё равно и +9 в ничьих даёт, и проигрывает их потом ещё.

Maratka
11.11.2018, 23:19
Ну вот на 4с играет Лила с таблицами, толку-то чуть, всё равно и +9 в ничьих даёт, и проигрывает их потом ещё.
+9 не видал, но +3 в ничейной позиции с полными шестифигурками плюс часть семифигрурок (активно кстати говоря используемых) - факт.

Т.е. походу имеем: LZ таблицы гребет не так активно, как A-B движки (тут вероятно виновата недостаточная глубина), но еще и использует их криво.

Для 100% диагностики по семифигурками понадобятся таблицы Ломоносова, что проблема для многих участников этого форума, но ничто не мешает проверить по Налимову шестифигурные концовки (всего терабайт!), поставив заведомо ничейные позиции: сравнить, как их оценивает LZ в сравнении со SF, имея полные шестифигурки syzygy.

Вот использование их в обучении - это дело,
Это вообще должно быть вообще аксиомой. Идеальные ходы в известных позициях. Но отсюда получаем, что подходят только таблицы Налимова (либо их семифигурный аналог - Ломоносов).
syzygy для этого подходят так себе - показывают чье преимущество, но не показывают правильный ход, т.е. их по сути можно использовать лишь как акселератор расчетов, но не как универсальный справочник.

ChessMan
11.11.2018, 23:28
+9 не видал, но +3 в ничейной позиции с полными шестифигурками плюс часть семифигрурок (активно кстати говоря используемых) - факт.

Т.е. походу имеем: LZ таблицы гребет не так активно, как A-B движки (тут вероятно виновата недостаточная глубина), но еще и использует их криво.

Для 100% диагностики по семифигурками понадобятся таблицы Ломоносова, что проблема для многих участников этого форума, но ничто не мешает проверить по Налимову шестифигурные концовки (всего терабайт!), поставив заведомо ничейные позиции: сравнить, как их оценивает LZ в сравнении со SF, имея полные шестифигурки syzygy.

Скачивать таблицы Налимова совсем не обязательно - http://chessok.com/?page_id=361
Да и семифигурки тоже: https://syzygy-tables.info/ (пока вроде не все)

sovaz1997
11.11.2018, 23:42
Семифигурки ещё летом досчитали до конца :)

Maratka
11.11.2018, 23:45
Скачивать таблицы Налимова совсем не обязательно
Скачивать как раз таки обязательно, т.к. иначе придется писать интерфейс для доступа к серверу и обеспечивать его функционирование как таковое (в т.ч. низкий пинг для любого региона, скажем сервер в Германии будет весьма лениво отзываться на запросы из Австралии, а значит понадобятся клоны серверов в зависимости от региона).

Да и скачать терабайт по нынешним меркам не проблема ни с точки зрения скорости, ни с точки зрения объема для хранения.
У меня например RAID-5 из шести 2-х терабайтных дисков (полезная емкость - 9 терабайт), причем с точки зрения емкости, а не скорости доступа, его легко заменить на 4*8 с общей емкостью в 22 терабайта: в полтора раза меньше дисков при в более чем в два раза бОльшей емкости массива.

Vizvezdenec
12.11.2018, 00:17
+9 не видал, но +3 в ничейной позиции с полными шестифигурками плюс часть семифигрурок (активно кстати говоря используемых) - факт.

А я вот вполне себе видел, ладейник в партии SF-lc0, SF даёт -1.5, но там крепость, ну а лила давала -9,5, а потом постепенно опускала до 0.00.
Причём не то чтобы белым надо было защищаться единственными ходами - план защиты был очень прост даже для второразрядника.

Vizvezdenec
13.11.2018, 15:50
Ещё особенность - в испанке белыми Лила на 4с уже дважды пошла в Маршалла, один раз проиграла Комодо, второй раз против стокфиша показывала +1 на 14 ходу и сразу уронила оценку до -0.2 на следующем же ходу.
Видимо, у неё некоторое слепое пятно тут, AB движки сильные в Маршалл не ходят - считают его плохим для белых.

svoitsl
13.11.2018, 21:40
Вышел RC4 (https://github.com/LeelaChessZero/lc0/releases)
Changelog
Microseconds have 6 digits, not 3! (#505)
use bestmove_is_sent_ for Search::IsSearchActive() (#502)

Кол-во обучающих игр за сутки снова превысило 1 млн.
Сеть 20 кажется все таки не совсем забросили, значит какие то надежды у кого то есть.

сеть 31131 против 22182 +85 реальных эло !
То есть сеть за 15 млн игр превысила уровень игры сети обучающейся более чем 50 млн игр
При увеличении темпов обучения уже к середине декабря возможно обучение теста 30 будет закончено

sovaz1997
13.11.2018, 21:51
Вышел RC4 (https://github.com/LeelaChessZero/lc0/releases)
Changelog
Microseconds have 6 digits, not 3! (#505)
use bestmove_is_sent_ for Search::IsSearchActive() (#502)

Кол-во обучающих игр за сутки снова превысило 1 млн.
Сеть 20 кажется все таки не совсем забросили, значит какие то надежды у кого то есть.

сеть 31131 против 22182 +85 реальных эло !
То есть сеть за 15 млн игр превысила уровень игры сети обучающейся более чем 50 млн игр
При увеличении темпов обучения уже к середине декабря возможно обучение теста 30 будет закончено

Да, прогресс 30-й сети очень хороший, вот только погрешность велика:

https://groups.google.com/forum/#!topic/lczero/TyLPUORVhLo
Т. е. вывод был сделан по 30 партиям.

P. S. У меня сегодня патч Zevra против сборки-мастера сыграла 17-1. А в итоге усиления не оказалось. В общем, я не верю таким тестам. Там может быть как 0, так и 160))

Maratka
13.11.2018, 22:04
Да, прогресс 30-й сети очень хороший, вот только погрешность велика:
не только:

Note: In game 28, I had to smile about the final between K (22182) and K + Q (31131).
The K (31131) did not move at all and the Q plays zigzag without understanding. Only late does the K (31131) start moving. Right before the 50 move rule ends. I think in the end game is still much work for 3xxxx ..

_______
А вообще хотелось бы сравнения с сетью 10. Так оно как-то нагляднее.

Vizvezdenec
13.11.2018, 22:09
Если я правильно понимаю, то как раз в эндшпилях у 30+ сети будет ещё больше проблем, чем у прошлых вариаций.
Потому что размер сети больше -> меньше роллаутов/единицу времени -> хуже игра с очень малым количеством фигур.
Та самая мини-сеть, которая набирала против стокфиша в 8-фигурных позициях 52%, была 8х64, там важна скорость, а не размер.
Вообще задался бы кто-нибудь целью наиграть сети для разного количества материала на доске, т.е. 30х256 для полной доски, 15х128 когда половины материала нет, 8х64 когда его совсем мало, и как-нибудь сшить это всё друг с другом (я знаю, что это нетривиальная задача, но этим оно и интересно)... Некий аналог tapered eval в AB движках.
Мне кажется, тут куча эло бы нашлась, но...

Maratka
13.11.2018, 22:14
Вообще задался бы кто-нибудь целью наиграть сети для разного количества материала на доске, т.е. 30х256 для полной доски, 15х128 когда половины материала нет, 8х64 когда его совсем мало, и как-нибудь сшить это всё друг с другом (я знаю, что это нетривиальная задача, но этим оно и интересно).
Зачем сшивать, если можно просто подключать нужную сеть при при достижении заданного количества фигур? IMHO, Тут работы на десяток минут.

svoitsl
13.11.2018, 22:14
вывод был сделан по 30 партиям.
есть и другой тест (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223)
Там сеть 31000 не дотягивает до 21850 тоже порядка 80 Эло
А до сети 10 не хватает порядка 400 Эло

Maratka
13.11.2018, 22:16
Та самая мини-сеть, которая набирала против стокфиша в 8-фигурных позициях 52%, была 8х64, там важна скорость, а не размер.
Ну и тренировку запустить со SF'шем, к которому подключены как минимум шестифигурки, лучше -семб.
По сути получится тренировка на практически безошибочно играющем сопернике.

Vizvezdenec
13.11.2018, 22:20
Зачем сшивать, если можно просто подключать нужную сеть при при достижении заданного количества фигур? IMHO, Тут работы на десяток минут.
Ну сшивать затем, чтобы 30-сеть не пошла на то, что упрощается до бито-ничейной позиции, которую меньшая сеть вместо +3.2 оценит на +0.1 :)

Maratka
13.11.2018, 23:42
Это то понятно.
Но не проще ли в движке написать условие, что если у нас больше чем 20 фигур, то использовать основную сеть, если > 8, но не более 20 - то вторую сеть, (которую тренировать на соответствующих позициях), и если равно 8 или меньше фигур, то сеть минимальной разрядности (которую в свою очередь тренировать не на партиях со стартовой позиции, а исключительно на эндшпилях, причем в качестве спарринг-партнера дать SF с семифигурками, который будет играть практически идеально, а значит сможет обучить и LZ играть не хуже)?

Зачем что-то сшивать, когда можно просто поставлять движок с тремя сетями, и использовать нужную в зависимости от позиции?

Vizvezdenec
13.11.2018, 23:53
Ну это самый простой выход, разумеется.
Но не самый эффективный, наверное. Но его улучшение, конечно, потребует существенной доработки алгоритма, в то время как тупой ступенчатый переход, конечно, куда как проще реализовать.

Maratka
14.11.2018, 00:03
Но не самый эффективный, наверное.
Само собой, что это не идеально, т.к. будут проблемы на стыках, скажем если у нас сети для мительшпиля и эндшпиля наиграны на 20 и 8 фигурах соответственно, то не факт, что средняя сеть в любой позиции с 9 фигурами будет лучше младшей сети.
Но IMHO, это лучше чем то что имеем сейчас - первое, и очень просто делается - второе. Если среднюю сеть еще придется долго (ну от месяца наверное) тренировать, то минимальную восьмифигурную можно выдрессировать за единицы дней. Причем что важно, так это то, что и начать лучше как раз таки с минимальной сети, ибо самое слабое место LZ- это как раз таки эндшпили, на которые можно обучиться очень быстро.

sovaz1997
14.11.2018, 08:27
Оценка силы игры 30xxx: https://docs.google.com/spreadsheets/d/19UL5a9I3M_TjIYwTpJQKdCi2RJHpxDD9YHnRogrwTnc/edit#gid=0

svoitsl
16.11.2018, 00:08
Оценка силы игры 30xxx
Да, интересная статистика, получается, что за последние 4 млн игр (от сети 31060 до 31190) реальный уровень даже снизился...

Тем временем разработчики не торопятся релизить 0.19 (уже прошло 12 дней вместо обещанных 7-10), наверное хотят найти и устранить побольше ошибок.

Maratka
16.11.2018, 00:24
На днях (возможно даже завтра) запущу очную дуэль 11250 против последней из серии 30xxx на момент начала турнира.
Все эти таблицы дело путанное, зачастую оценка рейтинга косвенная, через посредника (считаются очки, набранные разными сетями против третьего движка). По ссылке выше например - против Lazer.
https://www.dropbox.com/sh/guk6jqmk1vsmfoj/AAD4G6vjdkSC4oPM7-ABdCoKa?dl=0

Виндхук
16.11.2018, 12:00
На днях (возможно даже завтра) запущу очную дуэль 11250 против последней из серии 30xxx на момент начала турнира.
Можете пока не запускать, пока и так всё ясно, человек выложил свой тест:

I completed a 100 games match between ID 31211 (self elo 4956) vs ID 11248
hardware: 2080Ti I also used TBs
Time control: 2min +1sec

11248 won +41 =58 -1 with an ELO advantage of +147

So while the self ELO jumped around :

31116 was -150 ELO (4700 self ELO)
31174 was -230 ELO (4841 self ELO)
31211 was -147 ELO (4956 self ELO)

Maratka
16.11.2018, 15:23
Ну в общем-то результат вполне приемлемый.
Учитывая, что 1 ELO selfplay = 0,3 - 0,5 реальных ELO, и темпы роста сети, за неделю вполне может быть уже равенство (конечно же при условии, что темп обучения сильно не упадет).

svoitsl
16.11.2018, 18:18
и темпы роста сети,
реальные темпы роста скорее отрицательные, хотя самоэло и выросло
что за последние 4 млн игр (от сети 31060 до 31190) реальный уровень даже снизился...
https://b.radikal.ru/b06/1811/8b/a2c0f95e4bd9.png

Maratka
16.11.2018, 18:46
реальные темпы роста скорее отрицательные, хотя самоэло и выросло
Так интервал то пожирнее берите, а не несколько дней. :)
Опять же, где тут матчи одной сети с другой?
Я их не вижу. Я вижу партии одной сети против Laser, и другой сети против Laser, т.е. рейтинг считается через прокладку, а не напрямую, а прокладка вносит свои погрешности, помимо погрешностей собственно разных сетей.

svoitsl
17.11.2018, 19:26
Вышел RC5 (https://github.com/LeelaChessZero/lc0/releases/)

Changes

OpenCL: replace thread_local with a resource pool. (#516)
optional wtime and btime (#515)
Make convolve1 work with workgroup size of 128 (#514)
adjust average depth calculation for multivisits (#510)

По моему RC5 раньше не разу не было....
А тут изменений довольно много
тест (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223)
Все же учуял небольшой рост реального Эло, до целых 3197 Эло!!! Это больше чем у 21850 на аж!!! 17 Эло

Maratka
18.11.2018, 12:50
Вчера скачал сеть, запустил матч.
Имеем:

http://www.imageup.ru/img25/3215782/11.png (http://www.imageup.ru/img25/3215782/11.png.html)

Однако, за это время selfplay-рейтинг поднялся на ~500 ELO.
Реальных полста думаю наскребется... Вечером перезапущу матч с актуальной на вечер сетью.

svoitsl
18.11.2018, 14:06
Ну раз 31300 уже вышла то тут (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223) и тестик может у вечеру замутят
с TC =1 мин для 150 игр вполне достаточно 1х2х150=300 мин = 5 час

с актуальной на вечер сетью.
А может и актуальным RС5 ... (если не успеют зарелизить)

Кстати число игр кажется достигло своего максимума за долгое время более 1.3 млн в сутки

Maratka
18.11.2018, 14:28
А может и актуальным RС5 ... (если не успеют зарелизить)
Сравнение будет корректным только с одним и тем же движком, ибо я проверяю сети, а не движки.
Можно проверить и движки - в этом случае должна быть одна и та же сеть.

Maratka
18.11.2018, 14:30
с TC =1 мин для 150 игр вполне достаточно 1х2х150=300 мин = 5 час
Это когда 1080/2080.
На моей 960 не прокатит: для нее это слишком мало времени, будет очень высокий процент проигрышей по "зевкам", которые испортят картину.

Потому, семь минут плюс пять секунд. Тут более-менее.

Maratka
18.11.2018, 14:35
В общем, запустил предварительный тест с сетью 31300. Уже могу сказать, что рост есть, и рост далеко не на десяток ELO. Видно по графам оценки позиии: даже когда 31300 проигрывает, делает она это куда как "плавнее", и партию затягивает на заметно бОльшее количество ходов.

svoitsl
18.11.2018, 16:01
Это когда 1080/2080.
у них GTX 980ti и считают что и так сойдёт .
(Пишут что 4 knps)

Maratka
18.11.2018, 16:15
Ну у меня где-то 2 knps. И я не считаю, что как они проводят матчи - то это сойдет.
Более того, я бы и у себя увеличил время хотя бы до 15+5, но тогда совсем уж долго ждать.

Maratka
18.11.2018, 22:21
В общем, запустил предварительный тест с сетью 31300.
Получается ~60 ELO. Напомню, что это набрано за сутки! Ну правда по всей видимости это были очень удачные сутки, но тем не менее, набирая столько даже за неделю, сеть 3xx догонит 11250 за ~месяц.
Кстати, за вечер рейтинг selfplay подрос еще на ~150 ELO, что должно соответствовать ~25 реальным.

svoitsl
18.11.2018, 22:53
Получается ~60 ELO
Спасибо за хорошие новости

сеть 3xx догонит 11250 за ~месяц.
Будем надеяться, что в div 2 TCEC 14 будет играть уже новая сеть
(и в то, что 11248 или 11250 попадет в первую пару div 3)

за вечер рейтинг selfplay подрос еще на ~150 ELO, что должно соответствовать ~25 реальным.
Вот только не совсем понятно с каким знаком? Вполне возможно что и -25 Эло

Maratka
18.11.2018, 23:12
Спасибо за хорошие новости

Пожалуйста ;)

Будем надеяться, что в div 2 TCEC 14 будет играть уже новая сеть
Без разницы. 11250 вполне достаточно для прохода в высший дивизион.


Вот только не совсем понятно с каким знаком? Вполне возможно что и -25 Эло
Вполне понятно. Плюсом. Маловероятно, что погрешности так сложились, что полтора десятка сетей все вместе показали завышенный результат.
В любом случае к утру узнаем, если LZ пробьет планку в 6100 selfplay, то очень вероятно, что это еще плюс 30-40 реальных ELO. Хотя конечно рост может и замедлится. Потому ждем.

sovaz1997
18.11.2018, 23:42
Да, за Lc0 можно сейчас не беспокоится, он спокойно дойдет до Премьер-дивизиона. Более интересно, что дальше: ведь дальше новая сеть может понадобиться в финале, например. И если эта сеть превзойдет Stockfish или будет хотя бы на уровне, это будет действительно интересно. Причем превзойдет не путем наращивания мощностей, а самой сетью.

Кстати, последние версии сетей видят ход Alpha Zero Bg5 (Stockfish не видит):

rn3r1k/pn1p1ppq/bpp4p/7P/4N1Q1/6P1/PP3PB1/R1B1R1K1 w - - 3 21

Stockfish здесь рисует преимущество в 1.5 пешки после b4, но если ему показать правильный ход, то оценка дойдет до +2 (не сразу, сначала он не будет вобще видеть какое-либо преимущество).

Maratka
19.11.2018, 11:33
Вчера скачал сеть, запустил матч.
Имеем:

http://www.imageup.ru/img25/3215782/11.png (http://www.imageup.ru/img25/3215782/11.png.html)

Однако, за это время selfplay-рейтинг поднялся на ~500 ELO.
Реальных полста думаю наскребется... Вечером перезапущу матч с актуальной на вечер сетью.

Итого, имеем разницу. Да, большие погрешности конечно же, но тренд в любом случае понятен: сеть за позапрошлые сутки поумнела на много десятков ELO:

http://www.imageup.ru/img25/3216461/222.png (http://www.imageup.ru/img25/3216461/222.png.html)

При этом, рейтинг selfplay за последние сутки поднялся еще на 400 ELO. Если эти ELO равноценны тем, что сейчас вы смотрите на таблицах, то это еще ~50 реальных ELO (да, да, погрешность большая, но играть совсем уж много партий - значит не выйдет проверить сегодняшнюю сеть, а проверить хочется, хотя бы в рамках тренда).


______
Запускаю новый турнир с сетью 31338.

Maratka
19.11.2018, 12:10
Кстати, последние версии сетей видят ход Alpha Zero Bg5 (Stockfish не видит):

За сколько времени, имея железо с ~2 knps?

Michael Strelkov
19.11.2018, 12:45
Народ, подскажите, какой сейчас примерно рейтинг у Alpha Zero? Во Фриц его засунуть можно, есть ли экзешник?

Maratka
19.11.2018, 13:13
Рейтинг неизвестен, "засунуть" никуда нельзя, это закрытый проект.

Michael Strelkov
19.11.2018, 13:31
Рейтинг неизвестен, "засунуть" никуда нельзя, это закрытый проект.

Нет, вот этот движок, насколько я понял, можно поставить во Фриц!
http://forchess.ru/showpost.php?p=78798&postcount=1298

Maratka
19.11.2018, 13:58
Его можно, без вопросов.
Только от AlphaZero в нем только и есть, что общая идея самообучения игре.

byan_mivv
19.11.2018, 14:02
Да, можно поставить. Только он называется не Альфа Зеро, а Leela Chess Zero или сокращенно lc0.
А остальные действия по посту от Artem16, #1298...

Michael Strelkov
19.11.2018, 14:19
А какой примерно рейтинг у него на данный момент? Имеет ли смысл в первенство его ставить?

Maratka
19.11.2018, 14:29
А какой примерно рейтинг у него на данный момент?
Зависит от железа. Если очень примерно, то на равноценном железе +/- как у Komodo.

Какой у Вас процессор и какая видеоплата?

Michael Strelkov
19.11.2018, 15:32
Зависит от железа. Если очень примерно, то на равноценном железе +/- как у Komodo.

Какой у Вас процессор и какая видеоплата?

Intel Core i7-2630QM, 2.0GHz, 8ГБ ОЗУ
Ну, это уже очень круто, есть он как Комодо!

Maratka
19.11.2018, 15:44
Видеоплата какая?
Впрочем, на Вашем ноутбуке судя по процессору скорее всего ничего путного не установлено, и LZ на видео не запустится.

Michael Strelkov
19.11.2018, 15:54
Собственно, машина вот:
https://3dnews.ru/610615

Maratka
19.11.2018, 16:10
OpenCL 1.1 - не пойдет, если только новыми драйверами не "дотянули" поддержку.
Про CUDA ничего не могу сказать, пробовать нужно.
Скачайте
https://github.com/LeelaChessZero/lc0/releases/download/v0.18.0/lc0-v0.18.0-windows-cuda.zip

и

https://github.com/LeelaChessZero/lc0/releases/download/v0.18.0/lc0-v0.18.0-windows-opencl.zip

скачайте последнюю сеть с https://www.lczero.org/networks/, и положите в каталог с программой.

Запустите по очереди, наберите в консоли команду
uci
go infinite

Покажите результат.

Burcontovk
19.11.2018, 18:02
Да, за Lc0 можно сейчас не беспокоится, он спокойно дойдет до Премьер-дивизиона. Более интересно, что дальше: ведь дальше новая сеть может понадобиться в финале, например. И если эта сеть превзойдет Stockfish или будет хотя бы на уровне, это будет действительно интересно. Причем превзойдет не путем наращивания мощностей, а самой сетью.

Кстати, последние версии сетей видят ход Alpha Zero Bg5 (Stockfish не видит):

rn3r1k/pn1p1ppq/bpp4p/7P/4N1Q1/6P1/PP3PB1/R1B1R1K1 w - - 3 21

Stockfish здесь рисует преимущество в 1.5 пешки после b4, но если ему показать правильный ход, то оценка дойдет до +2 (не сразу, сначала он не будет вобще видеть какое-либо преимущество).

Sf в тактике видит мгновенно. Не знаю у меня оценка выше 1.50 не поднималась. b4 1.40

svoitsl
19.11.2018, 18:36
Интересный результат (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223)
https://c.radikal.ru/c37/1811/a9/dbe4cf74e45e.png
самоэло вырос на 860 , а реальный уменьшился на 14 Эло

sovaz1997
19.11.2018, 18:47
Кстати, ведь вчера запускал тест 100 nodes Lc0 30x vs Lc0 11250, тоже около 190 пунктов разница была)

svoitsl
19.11.2018, 18:55
Пока результат несколько не устойчив (https://groups.google.com/forum/#!topic/lczero/jBR97eoVIno)

31282 is 48 ELO below 11248
31295 is 90 ELO below 11248
31300 is 126 ELO below
31304 is 90 ELO below
31311 is 77 ELO below
31316 is 62 ELO below
31325 is 100 ELO below
31334 is 154 ELO below
31343 is 100 ELO below

Vizvezdenec
19.11.2018, 18:56
Sf в тактике видит мгновенно. Не знаю у меня оценка выше 1.50 не поднималась. b4 1.40
Я когда-нибудь разберусь с тем, как использовать возможности position.cpp в search.cpp и попробую что-то с этим сделать (например, меньше усекать ходы, когда у нас большинство фигур находятся на дистанции 5+ от короля... :) ).

Maratka
19.11.2018, 21:28
Говорят, тут большую роль играет параметр "безопасность короля".
Т.е. можно не менять параметры отсечения вариантов, а форсированно уменьшить параметр безопасности вражеского короля, и движок пойдет на материальные жертвы.

Maratka
19.11.2018, 21:31
Пока результат несколько не устойчив
Сейчас по идее должно нормализоваться, движки уже ~10 турниров (т.е. ~300 тыс. партий) топчатся около 6200, утаптывают значения сетки.

svoitsl
19.11.2018, 21:47
движки уже ~10 турниров (т.е. ~300 тыс. партий) топчатся
Они могут топтаться ещё 200 или даже 300 турниров, прежде чем уменьшат LR

Maratka
19.11.2018, 21:48
Если будет явное топтание, его уменьшат.

Michael Strelkov
19.11.2018, 23:41
Запустил всё по рецепту (http://forchess.ru/showpost.php?p=78798&postcount=1298). Движок во Фрице работает, но показывает скорость 0 и глубина очень небольшая.:sad:

Maratka
20.11.2018, 00:00
Движок во Фрице работает
Какой движок? Windows-blas?
Он и должен быть медленным, т.к. работает на процессоре.

Maratka
20.11.2018, 00:00
вложении
А покрупнее вложения у Вас нет?

svoitsl
20.11.2018, 00:04
показывает скорость 0
К сожалению многие оболочки почему то показывают скорость не в узлах, а в килоузлах и если их набирается меньше 1000 то просто показывают 0, глубина у LC0 и не будет уж очень большой, скорее меньше 10

svoitsl
20.11.2018, 00:08
Во вложении!
какие то картинки у вас не очень ... четкие....

А ведь между тем 0.19 (https://github.com/LeelaChessZero/lc0/releases/tag/v0.19.0) все же зарелизили (https://blog.lczero.org/)
с небольшим изменением
remove Wait() from EngineController::Stop() (#522)
Если не будет найдено какого либо серьезного глюка за неделю то можно и юзать...

Maratka
20.11.2018, 00:12
и если их набирается меньше 1000 то просто показывают 0
Fritz округляет. 500 и менее для него нуль, 501 - тысяча

Michael Strelkov
20.11.2018, 00:26
А покрупнее вложения у Вас нет?
Что-то не срослось в первый раз:(

http://www.fotolink.su/pic_s/7ec23f37796fc0b7023eac88e55b8fca.jpg
668x719(75.13 kB) (http://www.fotolink.su/v.php?id=7ec23f37796fc0b7023eac88e55b8fca)
www.fotolink.su (http://www.fotolink.su)
http://www.fotolink.su/pic_s/02b802db7554e20d559a21dd14f15e1b.jpg
668x719(71.12 kB) (http://www.fotolink.su/v.php?id=02b802db7554e20d559a21dd14f15e1b)
www.fotolink.su (http://www.fotolink.su)

В первый раз движок загрузился нормально, а сейчас виснет при загрузке. В режиме матча тоже не запускается.

Maratka
20.11.2018, 01:11
Перезагрузитесь.
Если не поможет - скачайте новый файл сети.

Michael Strelkov
20.11.2018, 01:52
Если не поможет - скачайте новый файл сети.

Спасибо! Это помогло.
Движок удалось запустить в матче. Сыграл тестовую партию с Амёбой: оценка сильно скачет, скорость подозрительно низкая. Есть ли толк в таком движке? Будет ли он играть в свою силу? Как получить скорость, как здесь (http://forchess.ru/showpost.php?p=78945&postcount=1302)?

[Event "LCZero test"]
[Site "ASUS G53S"]
[Date "2018.11.20"]
[Round "1"]
[White "Lc0 v0.19.0-rc5"]
[Black "Amoeba 2.6.w64p-l"]
[Result "1/2-1/2"]
[ECO "D00"]
[Annotator "0.14;0.19"]
[PlyCount "123"]
[TimeControl "300+5"]

{Intel(R) Core(TM) i7-2630QM CPU @ 2.00GHz 1995 MHz W=7.4 plies; 0kN/s;
Hiarcs14yBook.ctg B=28.1 plies; 1*153kN/s; Hiarcs14yBook.ctg} 1. d4 {B 0} d5 {
B 0} 2. Be3 {B 0} Be6 {B 0} 3. Bf4 {B 0} g6 {B 0} 4. Nf3 {B 0} Nf6 {B 0} 5. Nc3
{B 0} Bg7 {B 0} 6. e3 {B 0} O-O {B 0} 7. Be2 {B 0} Nh5 {B 0} 8. Bg5 {B 0} Nd7 {
B 0 Оба Последний ход в книге} 9. O-O {0.14/5 11} h6 {0.19/23 10 (c6)} 10. Bh4
{0.01/6 11} g5 {0.24/24 13 (c6)} 11. Bg3 {-0.16/7 17 (Ne1)} Nxg3 {-0.13/20 9}
12. hxg3 {-0.13/6 10 (fxg3)} c6 {-0.20/20 13} 13. Bd3 {-0.34/6 17 (a4)} Bg4 {
-0.44/20 9} 14. Qd2 {-0.34/6 15 (Be2)} e5 {-0.78/23 11} 15. Nxe5 {-0.01/8 11
(Be2)} Nxe5 {-0.63/22 13} 16. dxe5 {-0.02/7 9} Bxe5 {-0.66/21 8} 17. e4 {
-0.06/7 15 (Ne2)} dxe4 {-0.84/22 13} 18. Nxe4 {-0.32/7 9} Qe7 {-0.89/21 8 (Re8)
} 19. Rae1 {0.06/5 16} f5 {-0.76/20 12} 20. Qa5 {0.47/6 13 (Nc3)} b5 {-0.67/22
12 (b6)} 21. Nd2 {-0.19/6 14 (Nc3)} Rfe8 {-0.14/21 8 (Qd6)} 22. Qa6 {1.54/6 15
(Nf3)} Qd7 {0.16/20 9 (Qd6)} 23. a4 {2.39/6 11} bxa4 {0.46/21 10} 24. Qxa4 {
1.84/7 17} Kh8 {0.52/21 8 (Bf6)} 25. Nc4 {2.03/5 11} Bd4 {0.59/24 11} 26. Qa5 {
2.02/6 17 (c3)} Qd5 {0.63/18 7 (f4)} 27. Qc7 {2.92/5 10} Rac8 {0.69/21 8 (Bh5)}
28. Rxe8+ {2.96/7 15 (Qd6)} Rxe8 {1.05/24 9} 29. Nd6 {2.68/6 14 (b4)} Bb6 {
0.19/27 8} 30. Qf7 {0.63/9 11} Qxf7 {0.23/27 8} 31. Nxf7+ {0.21/11 10} Kg7 {
0.31/29 7} 32. Nd6 {0.20/10 7} Rf8 {0.41/29 11} 33. Nc4 {0.36/9 12} f4 {
0.42/27 7} 34. gxf4 {0.48/8 10} Rxf4 {0.15/27 8} 35. Nxb6 {0.71/9 8} axb6 {
0.00/26 7} 36. Ra1 {0.96/8 9} c5 {0.00/28 8 (Kf6)} 37. Ra7+ {1.13/7 16 (b3)}
Rf7 {0.00/32 9} 38. Ra6 {1.05/8 11} Rf6 {0.00/34 9} 39. f3 {1.01/8 19 (Ra7+)}
Bc8 {-0.10/26 10 (Bh5)} 40. Ra7+ {0.70/8 12 (Ra8)} Rf7 {0.00/27 10} 41. Ra8 {
0.49/8 11 (Ra3)} Bf5 {0.00/29 7} 42. Bxf5 {0.30/7 10} Rxf5 {-0.01/30 10} 43.
Rb8 {0.24/7 12} Rf6 {0.01/30 7} 44. Kf2 {0.14/6 14} Rd6 {0.01/29 7 (h5)} 45. g4
{0.90/6 12} Re6 {0.01/33 8 (Rd2+)} 46. Rb7+ {0.70/5 12 (c4)} Kf6 {0.01/36 9}
47. Rh7 {0.43/6 11 (Rd7)} Ke5 {0.00/29 9 (Kg6)} 48. Ke3 {0.35/5 10 (Rd7)} Kd5+
{-0.27/25 8} 49. Kd3 {0.38/6 10 (Kd2)} c4+ {-0.24/28 9 (Rf6)} 50. Kd2 {0.33/6
9 (Kc3)} Rf6 {-0.17/29 6 (b5)} 51. Ke3 {0.26/6 10} Re6+ {-0.17/32 7} 52. Kd2 {
0.21/7 8} Rf6 {-0.16/33 9} 53. Ke3 {0.16/6 12} Kc5 {-0.15/32 8 (Re6+)} 54. c3 {
0.30/5 11} Re6+ {-0.15/36 7} 55. Kf2 {0.00/6 11 (Kd2)} Kb5 {-0.15/36 6} 56. Rc7
{-0.03/6 10 (Ra7)} Rc6 {-0.15/38 9 (Rd6)} 57. Rxc6 {0.61/6 7 (Ra7)} Kxc6 {
-0.11/40 6} 58. Ke3 {0.80/7 7} Kd5 {-0.07/41 8} 59. f4 {0.49/8 6} gxf4+ {
-0.04/41 6} 60. Kxf4 {0.15/9 4} Ke6 {0.00/45 6} 61. Ke4 {-0.03/7 6} Kf6 {
0.00/48 7} 62. Kf4 {-0.06/7 5 (Kf3) adjud. Согласился на ни~~ьo^} 1/2-1/2

Maratka
20.11.2018, 02:34
Спасибо! Это помогло.
Скриншоты где? Отдельно OpenCL, отдельно CUDA, отдельно CPU-версия?

Будет ли он играть в свою силу?
На CPU не будет.


Как получить скорость, как здесь?


Купить новый ПК (процессор любой, видео - GeForce, чем мощнее, тем лучше). ОЗУ от 16 гигабайт, SSD/HDD на любителя.
2 kn/s выдаст даже бюджетная 1050 Ti. Топовые платы выдают 40-80.

Michael Strelkov
20.11.2018, 08:52
Скриншоты где? Отдельно OpenCL, отдельно CUDA, отдельно CPU-версия?


На blas выкладывал в предыдущем посте.

Вот на cuda:

http://www.fotolink.su/pic_s/704a72b2c4acd8b9b9bd41e64543846d.jpg
670x719(81.66 kB) (http://www.fotolink.su/v.php?id=704a72b2c4acd8b9b9bd41e64543846d)
www.fotolink.su (http://www.fotolink.su)

А это на OpenCL:

http://www.fotolink.su/pic_s/67797455a6a17f9e3d3679469058deec.jpg
668x719(85.39 kB) (http://www.fotolink.su/v.php?id=67797455a6a17f9e3d3679469058deec)
www.fotolink.su (http://www.fotolink.su)

http://www.fotolink.su/pic_s/8d8ee9f60383ab834516324615554ae8.jpg
669x719(93.52 kB) (http://www.fotolink.su/v.php?id=8d8ee9f60383ab834516324615554ae8)
www.fotolink.su (http://www.fotolink.su)

Пока не пробовал их запускать во Фрице, вечером займусь. Я так понимаю, это версии должны быть быстрее, чем blas?

Rom77
20.11.2018, 09:14
Я так понимаю, это версии должны быть быстрее, чем blas?
cuda должна быть самая быстрая. Наберите: go nodes 1000 , дождитесь окончания расчетов и сравните скорость (nps)

Кстати, в 19-й версии можно ещё запустить Лилу с параметром benchmark и тоже посмотреть nps.

Maratka
20.11.2018, 14:03
Запускаю новый турнир с сетью 31338.
Сеть буксует на тот же уровне.

svoitsl
20.11.2018, 18:21
Сеть буксует на тот же уровне.
тут все же интересно узнать что за уровень, так как есть примеры, что он весьма разный, важно знать значение около которого он немного за стабилизировался :-)
-100 Эло или все же -200 Эло от уровня 11250 (11248)

Maratka
20.11.2018, 18:35
~180 ELO от уровня 11250

Алексей
20.11.2018, 19:04
Мне очень интересно, что будет если сеть тренировать против St, komodo, гудини?

svoitsl
20.11.2018, 19:37
~180 ELO от уровня 11250
интересно, а вот сеть 1х перед третьем снижением LR какой рейтинг имела?
(что бы знать на что можно надеяться)

Мне очень интересно,
Теоретически можно наверное сделать сеть сильную в отношении каждого из этих движков и более слабую по отношению к другому, но , предполагается, что даже тренировка на всех этих движках вряд ли создаст сеть значительно более высокого уровня, чем максимальный из них
Однако на примере Deus X можно видеть, что такой подход оказывается более экономичным в создании сетей не самого высокого уровня

svoitsl
20.11.2018, 20:50
Насчет большого скачка в 1000 самоэло (и не значительного реального) есть довольно не утешительное мнение (https://groups.google.com/d/msg/lczero/8tO04QdsFfI/FovA3OTiAQAJ)
that leela was just playing the same opening too frequently in its self-elo matches (i think it was the french?); it happened to become really good at beating itself in that opening but that doesnt necessarily generalise all that well to playing other openings as well so true elo didn't see anywhere near as big a boost

Michael Strelkov
21.11.2018, 01:21
Версия cuda как-то по-особенному запускается? Распаковываю её, кладу в одну папку с файлом сети, подключаю во фрице как uci движок, но при попытке запустить его, он просто висит бесконечно в загрузке!:sad:

По ходу, у меня только blas работает.

sovaz1997
21.11.2018, 01:36
Версия cuda как-то по-особенному запускается? Распаковываю её, кладу в одну папку с файлом сети, подключаю во фрице как uci движок, но при попытке запустить его, он просто висит бесконечно в загрузке!:sad:

По ходу, у меня только blas работает.

CUDA 10 нужен для 19-й версии

Maratka
21.11.2018, 02:04
Версия cuda как-то по-особенному запускается? Распаковываю её, кладу в одну папку с файлом сети, подключаю во фрице как uci движок, но при попытке запустить его, он просто висит бесконечно в загрузке!
По ходу, у меня только blas работает.
Обновите драйвера на видеоплату на сентябрь-октябрь 2018 года.

Maratka
21.11.2018, 02:05
Насчет большого скачка в 1000 самоэло (и не значительного реального) есть довольно не утешительное мнение
Ну зато во француженке она сожрет любого :D

______
Сейчас проверю без книг. Если это правда, последние сети должны стремиться играть француженку, причем результаты там будут отменными.

Константин85
21.11.2018, 03:43
Ну зато во француженке она сожрет любого :D

______
Сейчас проверю без книг. Если это правда, последние сети должны стремиться играть француженку, причем результаты там будут отменными.

Кто сожрет, кого??! Она же непробиваема, если черные не хотят проигрывать:preved:

Vizvezdenec
21.11.2018, 09:56
Ну зато во француженке она сожрет любого :D

______
Сейчас проверю без книг. Если это правда, последние сети должны стремиться играть француженку, причем результаты там будут отменными.

Не уверен.
В 4c во французской результаты у Лилы были средненькие. Она хорошо итальянку играет спокойную обычно.

Maratka
21.11.2018, 10:14
+20 =3 -1 в пользу старой сети.

svoitsl
21.11.2018, 20:14
Ну что ж, топтание на месте (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223)успешно продолжается
https://a.radikal.ru/a06/1811/17/07ce7c0b88f1.png
Хотя самоЭло вырос почти до небес (с 31300 по 31400 сети почти на 850 Эло, реальный только на 1 Эло), грозиться 10000 Эло пробить :-)

Michael Strelkov
21.11.2018, 21:46
CUDA 10 нужен для 19-й версии
Обновите драйвера на видеоплату на сентябрь-октябрь 2018 года.
Так что всё-таки надо сделать? Скачать этот Cuda 10 или дрова попытаться обновить?

svoitsl
21.11.2018, 21:50
Скачать этот Cuda 10
так вроде уже загружается полный комплект
а вот дрова обновить никогда не помешает

Maratka
21.11.2018, 21:50
Обновить драйвера. Нужная весрсия библиотеки CUDA поставляется уже с самим движком.

Michael Strelkov
21.11.2018, 21:59
Обновите драйвера на видеоплату на сентябрь-октябрь 2018 года.
Нашёл от 18 марта только!:sad:
https://www.nvidia.ru/Download/driverResults.aspx/132950/ru

Maratka
21.11.2018, 22:04
Значит CUDA не заработает.
Возможно пойдет старая версия, но толку от нее уже немного - движок тоже развивается не просто так.

Michael Strelkov
21.11.2018, 22:33
Чёртовы костыли! И почему авторы не сделают нормальный uci, как у Стокфиша?

Maratka
21.11.2018, 22:46
Так сделали. Вы его запустили, он у Вас работает. Все расчеты выполняет правильно:
Запустил всё по рецепту. Движок во Фрице работает, но показывает скорость 0 и глубина очень небольшая.

Michael Strelkov
22.11.2018, 00:34
Так сделали. Вы его запустили, он у Вас работает. Все расчеты выполняет правильно:
... но очень медленный!:sad:

Maratka
22.11.2018, 00:55
Ну так а как Вы хотели? :D
Там простенькая математика с большим количеством однотипных вычислений над однотипными данными, следовательно нужно много ядер, а вот производительность каждого из них без особой разницы.

Виндхук
22.11.2018, 08:36
Ну что ж, топтание на месте успешно продолжается
Странно, а по этим тестам всё не так плохо.
https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729

Maratka
22.11.2018, 11:49
Так там 31400 сеть. Ее возможно уже по другому учат, не на одном и том же дебюте.

Maratka
22.11.2018, 21:22
Проверяю сеть 31447.
На данный момент после 23 партий ~130 ELO отставания от 11250. Т.е. ~50 ELO реального роста за полтора суток.

Vizvezdenec
22.11.2018, 21:24
Проверяю сеть 31447.
На данный момент после 23 партий ~130 ELO отставания от 11250. Т.е. ~50 ELO реального роста за полтора суток.

50 эло погрешности после 23 партий это как бы норма :acute:

svoitsl
22.11.2018, 21:29
Т.е. ~50 ELO реального роста за полтора суток.
Пока наверное не все игры сыграны, посмотрим что будет когда все (завтра?)
Точность должна повыситься, а то тут на форуме (https://groups.google.com/d/msg/lczero/zhEM9e47zpw/hgSy2XcNAgAJ) вообще ужасные вещи пишут
I am running a match LC_31448 v SF_dev
SF in 4core i7 intel LC on 1080 Nvidia
Till now
Total Diff 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
stockfish (latest) 11 +17 = 0 = = = = = = = 1 0 1 1 = = = = = 1 0 = *
lc0_latest 10 -17 = 1 = = = = = = = 0 1 0 0 = = = = = 0 1 = *

Maratka
22.11.2018, 21:42
50 эло погрешности после 23 партий это как бы норма
Тут другая схема: когда разница в рейтингах столь огромна, прирост виден даже визуально.
Вот сейчас счет +8 =15 -0 в пользу 11250
Т.е. у новой сети ничьих в два раза больше, чем поражений.

А начинал я с сети 31260, и там счет был
+32 =22 -1, т.е поражений в полтора раза больше чем ничьих. Ну и общая разница 222 ELO.

Так вот, такой прирост виден сразу. Благо дебюты выбираются из книги те же, глубина книги та же и т.д. Т.е. тут теория вероятностей уже не работает, хотя формально - да, в на столь небольшом количестве партий погрешность выше разницы в рейтингах, т.е. тут как бы вообще замер смысла не имеет.

Vizvezdenec
22.11.2018, 21:47
Тут другая схема: когда разница в рейтингах столь огромна, прирост виден даже визуально.
Вот сейчас счет +8 =15 -0 в пользу 11250
Т.е. у новой сети ничьих в два раза больше, чем поражений.

А начинал я с сети 31260, и там счет был
+32 =22 -1, т.е поражений в полтора раза больше чем ничьих. Ну и общая разница 222 ELO.

Так вот, такой прирост виден сразу. Благо дебюты выбираются из книги те же, глубина книги та же и т.д. Т.е. тут теория вероятностей уже не работает, хотя формально - да, в на столь небольшом количестве партий погрешность выше разницы в рейтингах, т.е. тут как бы вообще замер смысла не имеет.
Ну я вот знаю, что 2 версии Комодо с разницей в 3 эло вполне могли в условиях CCRL выдавать похожие результаты.
Ну вот что сразу нашёл
http://www.computerchess.org.uk/ccrl/4040/cgi/engine_details.cgi?match_length=30&each_game=1&print=Details&each_game=1&eng=Stockfish%20270918%2064-bit%204CPU#Stockfish_270918_64-bit_4CPU
Fire и Ethereal сравните, вроде как бы Fire сильнее этой версии Ethereal, а результаты-то "явно" в другую сторону... :)

Maratka
22.11.2018, 21:53
Посмотрим другие тесты. Посмотрим мои тесты через пару дней и сотню сетей.
Если рост есть - по этим тестам он опять же будет виден. Не могут все ошибаться с примерно одной и той же разницей в пользу одного и того же соперника.

____
до утра пусть играют, наберется 50-60 партий, погрешность станет поменьше.
Следующий тест запущу, когда рейтинг selfplay пробьет 7200.

Maratka
22.11.2018, 22:04
Пока наверное не все игры сыграны, посмотрим что будет когда все (завтра?)
Точность должна повыситься, а то тут на форуме вообще ужасные вещи пишут
Против SF это вполне нормально. На этом железе +\- равные результаты будут у сети 11250, но не у 3xxx.

svoitsl
23.11.2018, 12:35
Следующий тест запущу, когда рейтинг selfplay пробьет 7200.
Уже пора запускать тест, две сети уже пробили 7200

Maratka
23.11.2018, 12:36
http://www.imageup.ru/img174/3219923/capture111.png (http://www.imageup.ru/img174/3219923/capture111.png.html)

Где-то так в общем получается...
Вполне себе результат.

Maratka
23.11.2018, 12:37
Уже пора запускать тест, две сети уже пробили 7200
Я только старый закончил. Вечером запущу.

Bullet
23.11.2018, 15:58
lc0_11248 vs lc0_31483
1000 nodes per move

[Event "?"]
[Site "?"]
[Date "2018.11.23"]
[Round "14"]
[White "lc0_11248"]
[Black "lc0_31483"]
[Result "0-1"]
[ECO "A25"]
[Opening "English"]
[PlyCount "74"]
[TimeControl "100+100"]
[Variation "Closed system (without ...d6)"]

1. c4 {book} e5 {book} 2. Nc3 {book} Nc6 {book} 3. g3 {book} g6 {book}
4. Bg2 {book} Bg7 {book} 5. d3 {+0.22/6 14s} Nge7 {-0.08/7 16s}
6. e3 {+0.25/6 9.0s} O-O {-0.15/7 12s} 7. Nge2 {+0.31/6 7.3s} d6 {-0.14/6 3.9s}
8. O-O {+0.29/6 6.0s} Re8 {-0.17/6 4.6s} 9. Rb1 {+0.45/5 11s} a5 {-0.19/6 12s}
10. a3 {+0.46/6 8.6s} Be6 {-0.21/7 8.0s} 11. b4 {+0.42/6 9.8s}
axb4 {-0.16/7 5.9s} 12. axb4 {+0.40/7 3.2s} d5 {-0.04/8 1.5s}
13. b5 {+0.37/8 3.6s} Na5 {-0.13/8 2.1s} 14. cxd5 {+0.54/7 3.7s}
Nxd5 {-0.26/7 0.98s} 15. Qc2 {+0.60/6 3.0s} Qd7 {-0.29/6 7.3s}
16. Ne4 {+0.94/6 11s} b6 {-0.34/6 13s} 17. Ng5 {+1.23/7 4.7s} Bg4 {-0.58/8 4.2s}
18. f3 {+1.35/8 6.1s} Be6 {-1.13/8 2.9s} 19. e4 {+1.46/7 3.0s}
Nf6 {-1.10/7 5.9s} 20. Nxe6 {+1.40/6 6.6s} Qxe6 {-1.00/7 4.3s}
21. f4 {+1.40/7 2.6s} c5 {-1.08/7 3.4s} 22. fxe5 {+1.13/6 5.2s}
Qxe5 {-1.09/7 5.7s} 23. Bb2 {+1.04/6 4.7s} Qe7 {-1.27/7 5.8s}
24. Nf4 {+0.99/6 4.8s} Rad8 {-1.17/6 7.1s} 25. e5 {+1.08/6 6.8s}
Ng4 {-0.80/7 8.2s} 26. Nd5 {+1.02/7 7.5s} Qg5 {-0.76/7 7.6s}
27. Rbe1 {+1.03/7 7.9s} Nxe5 {-0.61/6 19s} 28. Nxb6 {+0.79/6 9.3s}
Nxd3 {+0.07/10 12s} 29. Rxe8+ {+0.21/10 6.0s} Rxe8 {+0.01/9 1.2s}
30. Bxg7 {+0.10/9 1.7s} Qe3+ {+0.51/9 5.3s} 31. Kh1 {+0.03/10 1.1s}
Kxg7 {+0.57/9 1.1s} 32. Qa2 {+0.02/9 2.8s} c4 {+0.30/8 7.5s}
33. Nxc4 {-0.16/9 2.6s} Nxc4 {+4.46/7 18s} 34. Qxc4 {+0.02/10 0.90s}
Nf2+ {+14.16/7 2.9s} 35. Kg1 {+0.05/8 0.96s} Nh3+ {+36.90/6 0.10s}
36. Kh1 {-0.01/7 0.10s} Qg1+ {+M8/4 0.10s} 37. Rxg1 {+0.24/2 0.59s}
Nf2# {+128.00/2 0.10s, Black mates} 0-1

Maratka
23.11.2018, 17:29
Я только старый закончил. Вечером запущу.
Запустил против сети 31488.

svoitsl
23.11.2018, 17:47
Запустил против сети 31488.
спасибо, а то что то график очень красивый

https://c.radikal.ru/c25/1811/d6/19a5a2b13235.png
Хотелось бы узнать как на самом деле

тест (https://groups.google.com/d/msg/lczero/4iZKiRfQJjA/pyAPRRBYAgAJ)
довольно не плох
Lc0_31455 - Lc0_31486.

+115 real-elo для Lc0_31486 в ЭТОМ тесте. Разница между автоэло была + 382 для Lc0_31486.

Большое увеличение.

TC 30s / 0.3s, 40 игр, Cuda_Lc0_v019.0.
2 случайных движения открытия (изменение цвета), с запуском gaviota. Нет TB !!
https://16823473418456113263.googlegroups.com/attach/25810450f20a7/33.PNG?part=0.1&view=1&vt=ANaJVrERx4jtxvwyswH0X-r6OGA_ZtkPoe0DpLUV5sn3djvCNo8aDCb88y2Fj14KtfURlaMr dd6cZd9tNV2aFSpH4In7vQ0tBOZbQvDaLOJzfyz-Ly4j0wE

sovaz1997
23.11.2018, 18:45
svoitsl, может, график вообще в сингулярность скоро уйдет. Мечты))

svoitsl
23.11.2018, 23:05
ну что ж... оптимистичный сайт (https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729)
все таки накинул сети 31474 целых 7 Эло
И получается что 1025 самоЭло равны 33 реальным Эло
(если сравнить сети 31332 и 31474) за почти 9.7 млн игр.
А тем временем самоЭло решило закрепиться на уровне примерно 7400, если такое протянется до утра, то будет интересно тест запустить

sovaz1997
23.11.2018, 23:09
Корреляции нет, иногда и спад может дать реальный ЭЛО)

Vizvezdenec
24.11.2018, 00:10
Вообще это очень странно, т.к. ну не должно быть такой большой погрешности (1000 эло) в результате суммы 100 сетей с погрешностью по 20 эло...

sovaz1997
24.11.2018, 00:34
Там рейтинги уточняются и погрешность уменьшается (сравните разницу в Matches и реальную разницу в Networks). Там идёт постоянное уточнение, это видно, если обновить страницу. Дело в другом, думаю.

Vizvezdenec
24.11.2018, 00:47
Там рейтинги уточняются и погрешность уменьшается (сравните разницу в Matches и реальную разницу в Networks). Там идёт постоянное уточнение, это видно, если обновить страницу. Дело в другом, думаю.
Ничего там не уточняется :)
Вот просто беру два случайных матча.
31497 31496 true +103 -100 =279 2.2
Рейтинги сетей на графике 7397,72 и 7395,55 - разница те самые 2.2 эло.
31441 31440 true +127 -89 =267 27.4
Рейтинги сетей на графике 6902,26 и 6874,87 - разница те самые 27,4 эло.
И т.д.
Но погрешностями по 20 эло набрать за 100 подряд сетей 1000 эло погрешности (а ведь набрали - тесты сторонние никакой 1000 и даже 100 эло там не видят) по теорверу почти невозможно...

Maratka
24.11.2018, 00:53
Но погрешностями по 20 эло набрать за 100 подряд сетей 1000 эло погрешности (а ведь набрали - тесты сторонние никакой 1000 и даже 100 эло там не видят) по теорверу почти невозможно...
Там проскальзывала информация, что сеть достаточно долго (несколько суток, возможно и неделю) самообучалась играть фактически один дебют. Отсюда и непонятки - рейтинг селфплей взлетел до небес, ибо каждая новая сеть играла этот дебют лучше старой, но на других дебютах она как была минус 300 ELO от 11250, так и осталась. Дня три назад в настройки обучения внесли правки, теперь ждать, пока сеть наиграть миллионов десять партий, чтобы более-менее понимать и остальные дебюты.

Maratka
24.11.2018, 00:56
https://groups.google.com/forum/#!msg/lczero/8tO04QdsFfI/FovA3OTiAQAJ

Vizvezdenec
24.11.2018, 01:02
Забавно, что эта инкарнация Лилы сама идёт во французскую... :)

Maratka
24.11.2018, 02:07
Запустил против сети 31488.
В общем, дрова.
+13 =8 -0 в пользу 11250.
Даже не уверен, что есть смысл дальше ее тесты гонять.

Rom77
24.11.2018, 07:29
Вообще это очень странно, т.к. ну не должно быть такой большой погрешности (1000 эло) в результате суммы 100 сетей с погрешностью по 20 эло...
Каждая следующая сеть учится обыгрывать предыдущую. При этом она просто подстраивается под стиль предыдущей сети, находит её слабые места. Таким образом можно "прогрессировать" бесконечно, а реально просто ходить по кругу.

Vizvezdenec
24.11.2018, 07:32
Каждая следующая сеть учится обыгрывать предыдущую. При этом она просто подстраивается под стиль предыдущей сети, находит её слабые места. Таким образом можно "прогрессировать" бесконечно, а реально просто ходить по кругу.
Ну так же не происходило у 10 сети, да и у стокфиша так не происходит

Rom77
24.11.2018, 08:07
Ну так же не происходило у 10 сети, да и у стокфиша так не происходит
У сети 10 всё было то же самое. Очень яркая реализация принципа неудобных соперников: B выигрывает у A, С выигрывает у В. Казалось бы С намного сильнее А, но в то же время А выигрывает у С.

У Стокфиша используется отсечка по условию LLR, поэтому там более адекватные показатели, хотя и не без греха.

Vizvezdenec
24.11.2018, 08:26
У сети 10 всё было то же самое. Очень яркая реализация принципа неудобных соперников: B выигрывает у A, С выигрывает у В. Казалось бы С намного сильнее А, но в то же время А выигрывает у С.

У Стокфиша используется отсечка по условию LLR, поэтому там более адекватные показатели, хотя и не без греха.
Тут дело скорее не в LLR, а в том, что стокфиш играет на книге, в которой очень много разных позиций, причём падают они в случайном порядке.
Лила же играет со стартовой позиции + у неё очень низкая вариативность игры, там вроде как 50+% партий имеют первыми 20 ходами одно и то же...

Rom77
24.11.2018, 09:09
Тут дело скорее не в LLR, а в том, что стокфиш играет на книге, в которой очень много разных позиций, причём падают они в случайном порядке.
Я подозреваю, что и отсечка оказывает некоторое влияние (по крайней мере прекращение теста обычно случается на всходящих трендах процесса тестирования, что приводит к завышенной сумме эло положительных тестов).

Но наверное самым главным я считаю, что мы изменяем код Стокфиша не на основе ближайших партий, а по собственному разумению "лучшести" вообще. У Лилы же по сути сам процесс обучения сводится к подмечанию слабостей, исправлению ошибок предыдущей сети. Это не мешает ей ходить по кругу.

И ещё, в качестве косвенного подтверждения я хочу привести пример Лилы из игры Го, где используется отсечка по условию 55% набранных очков в 400 партиях: http://zero.sjeng.org/ (zero.sjeng.org) Там, по сторонним тестам, наблюдается четкое соотношение 1 : 3,1 реального эло к эло самотестирования (на графике). Но тем не менее, даже такая мягкая отсечка помогает реально расти, по крайней мере никак не "1025 самоЭло равны 33 реальным Эло", как в нашем случае. Ещё интересно, что в гошной Лиле соотношение 1 : 3,1 выдерживается достаточно строго.

Но даже плохая отсечка, это отсечка. В то время как у шахматной Лилы, в том числе и из 10-й серии, как я помню, наблюдались длительные тренды восхождения без ощутимой прибавки.

Rom77
24.11.2018, 09:46
Попытаюсь ещё по другому объяснить, сильно упрощая:

1. Допустим мы взяли последнюю нейросеть и сыграли партию с нею же самой, с перебором 800 поз/ход. Перебор вскрыл ошибки нейросети (поскольку 800 поз/ход лучше чем 0 поз/ход).

2. Потом мы нарезали из одной этой партии около 120-ти обучающих позиций/примеров с оценками (после партии каждая позиция теперь имеет кумулятивную оценку 800 позиций в дереве перебора).

3. Затем мы прогнали эти обучающие примеры от конца нашей нейросети, к её началу, по по пути немного изменяя коэффициенты нейросети. То есть мы произвели процесс обучения. Таким образом мы получили новую нейросеть.

4. Чем же эта новая нейросеть отличается от старой? Только тем, что она станет лучше играть в тех позициях, которые случились в партии (да и то если коэффициенты сдвинулись в нужную сторону).

5. Но изменения коэффициентов влияют на выводы нейросети во всех партиях вообще. Нейросеть может научиться играть лучше одну партию, но начнет хуже играть в тысяче других партий.

6. Немного расширяя пример, можно сказать, что учась на тысячах партиях против самой себя (а предыдущая нейросеть в первом приближении по сути она сама и есть), нейросеть может терять в силе на миллионах партий против независимого соперника (то есть в общей силе) или аналогично против нейросети на 100 поколений старше, которая по сути уже далеко ушла от нынешней и может считаться относительно независимой.

svoitsl
24.11.2018, 10:35
Попытаюсь ещё по другому объяснить
Картина довольно печальная....
СамоЭло уже скоро 7600 преодолеет, а вот увеличит это хоть насколько нибудь реальный Эло ещё неизвестно.
Странно, что эти проблемы не удалось решить на сетях 6х64.
Корреляции нет, иногда и спад может дать реальный ЭЛО)
Уж очень иногда, но чаще, как видим, рост может даже снижать реальный Эло.

Vizvezdenec
24.11.2018, 11:06
Есть у меня таки мнение, что принятие решений методом "проголосуем в дискорде" неизбежно будет порождать вот такое вот :)

Viktor
24.11.2018, 12:00
Да, решая одну проблему, порождаем следующие. Вот уж поистине нескончаемый процесс. А наш несгибаемый Стокфиш идет себе медленно и уверенно, но вперед!
Таким образом, можно сказать, что на велосипеде можно доехать из пункта А в пункт Б, а на Мерседесе вообще не доехать... разбившись по дороге. И статистика это подтверждает!

Maratka
24.11.2018, 12:05
Есть у меня таки мнение, что принятие решений методом "проголосуем в дискорде" неизбежно будет порождать вот такое вот

Думаю просто желания потребителей сильно выше даже теоритических возможностей разработчиков.

AZ в Гугле разрабатывался сколько? ~ два года?
А на выходе нам что рассказали? Что AZ сыграл сам с собой столько-то миллионов партий, на что ушло несколько часов, после чего - взял и выиграл у SF8.
Все сложности разработки, все пробы с ошибками, все тестовые обучения, тестовые сети и тестовые партии просто были вырезаны из сообщения об эпохальном событии, и прошли где-то в новостных каналах несколькими отдельными сообщениями мелким шрифтом, на которые мало кто обратил внимания.

И это Гугл, который по-сути своей не ограничен в бюджете, может нанять любое количество высококлассных программистов, дать им самое лучше оборудование и т.д.
А LZ пишет в свободное от работы время коллектив из ~пяти человек даром, не имея техники, а потому тратя на опыты по обучению недели, а не часы. Пошло обучение не туда - переучивать еще неделю.
Помню по своему опыту, как для команды LZ было открытием, что сеть, играя на уровне вполне приличного гроссмейстера (в те времена реальный ее рейтинг был где-то 2500-2700), зевает на ровном месте скрытые шахи, через которые у LZ выигрывают фигуру, а следом (что очевидно) и партию.
3K4/4r1p1/3n1bP1/7P/8/8/2k3Q1/8 b - - 0 1 (LZ - белые, сыграла Qh3-g2)
Исправление в коде заняло день, может два. А исправление в сети, которую начали обучать на основе этого кода - несколько недель. Сравните это с часами на полное обучение сети AZ ;)

svoitsl
24.11.2018, 13:49
Внезапно вдруг обнаружилось, что теория нейронных сетей вообще и применительно к шахматам в частности весьма не проработана и попытки реализовать (даже с учетом выложенного "глубоким умом") оказались весьма затруднительны и неоднозначны.
Странно ещё и то (для меня наверное только), что нет никакой связи или хотя бы слабой корреляции в обучении сетей разных размерностей, что не позволяет часть вопросов решить при обучении сетей меньших размеров.

а потому тратя на опыты по обучению недели, а не часы. Пошло обучение не туда - переучивать еще неделю.
В принципе уже довольно давно можно использовать для таких экспериментов ресурсы сообщества, если тренируя сеть 20х256 можно получить более 1 млн игр в сутки, то для сети 6х64 или 10х128 наверняка будет и побольше и обучить такие сети можно за несколько дней. Но получается, что обучая такие сети ничего нельзя сказать об обучении даже 15х192? ( а обучение 20х256 это уже вообще отдельная наука)

Magystr
24.11.2018, 13:49
У меня есть стойкое подозрение, что на последней сети Лила научилась читерить.
Вспомним нехитрую игру "камень-ножницы-бумага". Вероятность выигрыша 0.5. Это если нам не известна стратегия противника, или ее не существует. Если мы знаем, что вероятность выпадения камня выше других - ставим все время на "бумагу" и выигрываем. В игре со следующим релизом ставим на "ножницы", зная что у противника будет "бумага". И так по кругу, постоянно повышая рейтинг, при этом реально не усиливаясь.

svoitsl
24.11.2018, 18:31
оптимистичный сайт (https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729)
снова обновился...
На сей раз для сети 31510 они определили снижение на 17 Эло по сравнению с 31474
(рост самоЭло почти на 500)
то есть 5.7 млн игр привели (по отношению к 31332) к росту самоЭло почти на 1515 Эло и реальных на 16 Эло
https://d.radikal.ru/d34/1811/d0/363f04c0e6a5.png
А тем временем самоЭло ростет и скоро достигнет 7700 !!!

Пессимистичный сайт (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223)тоже обновился...
Но вы впрочем видите все сами
https://a.radikal.ru/a37/1811/45/797e614c3372.png

Алексей
25.11.2018, 15:51
Скоро видимо получим 10000 Self-Play Elo)

sovaz1997
25.11.2018, 16:23
У меня есть стойкое подозрение, что на последней сети Лила научилась читерить.
Вспомним нехитрую игру "камень-ножницы-бумага". Вероятность выигрыша 0.5. Это если нам не известна стратегия противника, или ее не существует. Если мы знаем, что вероятность выпадения камня выше других - ставим все время на "бумагу" и выигрываем. В игре со следующим релизом ставим на "ножницы", зная что у противника будет "бумага". И так по кругу, постоянно повышая рейтинг, при этом реально не усиливаясь.

Все нормально, думаю. Против ab-движков прироста нет, против себя - есть. Ощущение, что Lc0 пока накапливает потенциал, чтобы потом резко вырваться вперёд и обогнать предыдущие сети уже по сравнению с ab-движками. Напоминает то самое падение скорости обучения в середине, что было у AZ.

Maratka
25.11.2018, 18:12
Все нормально, думаю. Против ab-движков прироста нет, против себя - есть.
Против себя тоже нет. Прирост есть лишь против своей буквально что предыдущей версии, а не лучшей своей версии.

svoitsl
25.11.2018, 18:42
против своей буквально что предыдущей версии
Можно кончено провести тест например между 31550 и хотя бы 31350 и узнаем чего стоят 1500 само Эло

Maratka
25.11.2018, 18:58
Вы же сами давали ссылку на причину: сеть самооптимизировалась так, что стала играть один и тот же дебют, в ушерб всем прочим дебютам. Естественно, что ждать от этого чего-то хорошего нельзя: главный козырь LZ - понимание дебютов и миттельшпиля, за счет чего LZ частенько переигрывает SF (не говоря уже о прочих) оказался битым.

svoitsl
26.11.2018, 20:45
Кажется обозначился (https://docs.google.com/spreadsheets/d/1ZAIuHR6n-5JTxKQc0XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729) осторожный оптимизм
Сеть 31559 превысила прежний рекорд (сеть 31474) на целых 4 Эло
Однако пока это не позволило ей выйти за стат. погрешность.... а жаль
Само Эло тоже обнаруживает тенденцию к стагнации, уровень 8000 пока не превзойден.
Наверное скоро пора уменьшать LR

Maratka
27.11.2018, 21:47
Кажется лед тронулся, господа присяжные заседатели!
31616 идет весьма неплохо, после десятка партий - ничья с 11250.

svoitsl
27.11.2018, 21:58
Кажется лед тронулся
да, занятная ситуация (https://docs.google.com/spreadsheets/d/1XSJiCcQpCLv0fNwrUn7jXjdkZFU63YFEWpdXv6dSSg0/edit#gid=868347223)
https://c.radikal.ru/c17/1811/1b/3c96ba4cbf08.png

SergeyMZ
28.11.2018, 15:12
Всем приветы!
Я тут приобрел видюшку Nvidia GeForce GTX 1070 Gigabyte Windforce. Хотелось бы постестить Лилу в оболочке Комодо 12 (аналог Фрица16). Подскажите ,пожалуйста, где что скачать и как подключить?

Rom77
28.11.2018, 15:25
Всем приветы!
Я тут приобрел видюшку Nvidia GeForce GTX 1070 Gigabyte Windforce. Хотелось бы постестить Лилу в оболочке Комодо 12 (аналог Фрица16). Подскажите ,пожалуйста, где что скачать и как подкючить?
Подключайте как здесь написано:
http://forchess.ru/showpost.php?p=78595&postcount=1286

Только скачивайте последнюю, 19-ю версию Лилы в cuda-варианте.

SergeyMZ
28.11.2018, 15:36
Подключайте как здесь написано:
http://forchess.ru/showpost.php?p=78595&postcount=1286

Только скачивайте последнюю, 19-ю версию Лилы в cuda-варианте.

Спасибо большое!
Лилу скачал!
А нейросетку лучше скачать самую высшую по рейтингу или 11250, все-таки? :)

Rom77
28.11.2018, 15:38
А нейросетку лучше скачать самую высшую по рейтингу или 11250, все-таки?
Лучше 11250

SergeyMZ
28.11.2018, 15:55
Долго что-то подключается:

https://d.radikal.ru/d32/1811/f3/052fbc622937.png

sovaz1997
28.11.2018, 15:57
Так и должно быть, если первый запуск

Rom77
28.11.2018, 15:58
Долго что-то подключается:
При первом подключении Лила тестирует оборудование и подбирает настройки. Обычно несколько минут. При повторных подключениях вроде бы не должна.

Rom77
28.11.2018, 16:01
Да, и в шахматы Фишера она не играет.

SergeyMZ
28.11.2018, 16:05
Да, и в шахматы Фишера она не играет.

Это не совсем шахматы Фишера, а ASFC (антифрактал). Спасибо, установил начальную позицию. Жду, когда протестируется система и Лила запустится. :)

Maratka
28.11.2018, 16:19
Похоже Вы слишком долго ждете.
Обычное дело минута-две.

Все правильно сделали?
Сеть положили в каталог с движком?
Драйвера на видеоплату осенние?

sovaz1997
28.11.2018, 16:23
CUDA10 - обязательно для работы сети.
Лучше запустите в консольном режиме, чтобы увидеть, подгружается ли сеть

Maratka
28.11.2018, 18:13
Без комментариев, просто таблица с результатами:

http://www.imageup.ru/img13/3223956/capture.png (http://www.imageup.ru/img13/3223956/capture.png.html)

svoitsl
28.11.2018, 18:22
Без комментариев,
это те самые?
после десятка партий - ничья с 11250.

Maratka
28.11.2018, 18:36
Да. 10 партий все же мало. 60 конечно тоже не сахар, но уже на что-то похоже.
В принципе, могу до сотни доиграть (матч на 100 партий изначально настроен), но думается, что результат сильно не изменится.