Щоб ефективно використовувати квантові системи для запису, зберігання та обробки інформації, потрібні методи, які дозволяють точно вимірювати стан квантової системи та керувати нею. Проблема в тому, що в квантовому світі будь-яка взаємодія системи з навколишнім середовищем, включаючи вироблені вимірювання, трохи змінює її стан. Це призводить до помилок, які ускладнюють управління квантовими системами, особливо в реальному часі.

Для підтримки системи в бажаному стані використовують системи управління зі зворотним зв’язком, які реагують на невеликі зміни системи і повертають її в необхідний стан. Для простих систем силу, яку потрібно при цьому докласти, можна розрахувати аналітично. Однак в більш складних – і наближених до реального життя — випадках готового рішення немає.

У своїй роботі з використанням моделювання фізики показали, що глибоке навчання з підкріпленням ефективно справляється з цим завданням для системи з нелінійним гамільтоніаном — функцією, яка описує її повну енергію. Навчанням з підкріпленням називають один з методів машинного навчання, при якому алгоритм навчається, взаємодіючи з середовищем і отримуючи зворотний зв’язок. Значить, в кожному циклі навчання алгоритм якось впливає на стан квантової системи, а потім дізнається, що з цього вийшло.

До навчання взаємодії були випадковими, і спочатку алгоритму не вдавалося підтримувати систему в потрібному стані:

кулька на пагорбі візуалізує систему в потрібному квантовому стані, завдання алгоритму — утримати кульку в синій області / © okinawa institute of science and technology

Але вже через 300 циклів навчання ця задача давалася алгоритмом досить легко:

кулька залишається в синій зоні, але коливання його положення (червона лінія) ще досить великі / © okinawa institute of science and technology

А через 5000 циклів амплітуда необхідних впливів стала мінімальною:

кульку на місці, коливання амплітуди прикладеної сили (синя лінія), як і коливання положення кульки (червона лінія), мінімальні / © okinawa institute of science and technology

Таким чином, вченим вдалося показати, що глибоке навчання з підкріпленням ефективно повертає систему в майже чистий «стан кота шредінгера», при якому система знаходиться одночасно в двох станах, як і кіт в знаменитому уявному експерименті ервіна шредінгера. При цьому навчання відбувається повністю автономно. Автори статті вважають, що надалі й інші методи штучного інтелекту можна використовувати для управління квантовими системами.

Опублікована в журналі physical review letters.