Bàn về mạch biến phân

May 27, 2021 quantum

1.0. Lời tựa

Mạch biến phân (variational circuit), hay có tên gọi dễ hiểu hơn là mạch lượng tử được tham số hóa (parameterized quantum circuit)

1.1. Mạch lượng tử Adaptable

Mạch biến phân là nhóm thuật toán lượng tử phụ thuộc vào tham số tự do. Giống như những mạch lượng tử thông thường, chúng bao gồm ba thành phần:

Trạng thái khởi điểm ban đầu (ví dụ như $ 0\rangle$
Mạch lượng tử $U(\theta)$ được tham số hóa bởi tập các biến tự do $\theta$.
Phép đo trên đại lượng quan sát được (observable) $\hat{B}$. $\hat{B}$ có thể lấy được trên một phần của mạch.

Do đó, giá trị kì vọng của toàn bộ hàm $f(\theta)=\langle0

U^{\dagger}(\theta)\hat{B}U(\theta)\rangle$, giống như trường hợp cổ điển, sẽ là một đại lượng vô hướng nào đó. Tập biến tự do $\theta=(\theta_1,\theta_2,…)$ sẽ được thay đổi để tối ưu hóa giá trị của $f(\theta)$ (hay được gọi là hàm loss \ cost).

Mạch biến phân đã trở thành ý tưởng phổ biến trong việc thực thi các thuật toán lượng tử hiện nay.Tính hay ở mạch biến phân cho các thiết bị lượng tử hiện giờ là giải quyết được 2 tác vụ: (1) giảm thiểu độ lỗi của những mạch lớn (do lỗi từ bên trong những cổng cơ bản) và (2) giảm thiểu vấn đề phức tạp khi mỗi thuật toán lượng tử khi muốn thực thi phải phân rã thành tập các toán tử cơ bản chuẩn và được thực thi lần lượt trên phần cứng, thành một bước duy nhất bằng cách “học” một tác vụ nào đó.

Bằng cách này, các cổng có thể điều chỉnh một cách “tự nhiên” mà không cần phải lắp ghép, xây dựng từ một tập các cổng cơ bản. Ngoài ra, vấn đề lỗi có thể giảm thông qua quá trình tối ưu.

1.2. Tính chất

Tập tham số tự do $\theta$ và tập tham số cố định $x=(x_1,x_2,…)$ có thể truyền vào mạch dưới dạng đối số của các cổng cơ bản. Phương pháp này giúp chúng ta chuyển đổi thông tin cổ điển ($\theta$ và $x$) sang thông tin lượng tử (trạng thái $U(x;\theta)

0\rangle$). Tham số cố định có thể đóng vai trò là dữ liệu đầu vào cho bài toán machine learning.

Thông tin lượng tử có thể chuyển ngược trở về thông tin cổ đển bằng cách lấy giá trị kỳ vọng của đại lượng $\hat{B}$.

$f(x;\theta)=\langle\hat{B}\rangle=\langle0

U^{\dagger}(x;\theta)\hat{B}U(x;\theta)

0\rangle$

1.2. Ví dụ

Lấy ví dụ về máy tính lượng tử photon

1.3. Xử lý dữ liệu

Sau khi nhúng dữ liệu vào trạng thái lượng tử, chúng ta sẽ xử lý chúng.

Ví dụ: mạch $f(x_1,\theta_1)=x_1\cos(\theta_1)$ không có tham số tự do

Với standard gradient descent, chúng ta đã biết được quy trình để cực tiểu hóa giá trị của một hàm $f$ với tham số $\theta$ như sau:

Chọn giá trị khởi tạo cho $\theta$, $\theta=\theta_0$, có thể ngẫu nhiên, hoặc Glorot, hoặc He.
Tính đạo hàm riêng:

\[\begin{aligned} \nabla f_{\theta_i} = \frac{\partial f(\theta)}{\theta_i} \end{aligned}\]

Cập nhật giá trị mới cho $\theta$ bằng một số Optimizer, tiêu biểu là SGD hoặc Adam. Với SGD:

\[\begin{aligned} \theta^{t+1} = \theta^{t} - \alpha\nabla f_\theta \end{aligned}\]

Sau đó, chúng ta quay lại bước 2 và tính trong giới hạn $n$ lượt nào đó hoặc cho đến khi giá trị hàm Loss được tối ưu (có thể là cực tiểu hóa hoặc cực đại hóa, tùy theo cách chúng ta định nghĩa).

Tuy nhiên, khi đối mặt với những bài toán khó, hàm Loss mất rất nhiều thời gian để tối ưu hoặc có thể không bao giờ tối ưu được, thì cho dù chúng ta sử dụng bất kì Optimizer cổ điển nào thì cũng không thể giải quyết được. Hiện tượng này được gọi là Barren plateaus.

Để dễ tưởng tượng thì không gian tham số của chúng ta giống nhau một cao nguyên vô tận, có những đỉnh đồi nhưng đa số lại hoàn toàn phẳng. Kết quả là chúng ta không biết chỗ nào là hướng cần đi, và cuối cùng mắc kẹt tại chỗ cũ. Một vấn đề khác cũng có tính chất khá giống đó là rơi vào local minimum và rất khó để thoát khỏi và tìm global minumum.

Để giải quyết vấn đề này, chúng ta sẽ sử dụng một số kĩ thuật chẳng hạn như adapt learning rate hoặc adapt batch size, … Tuy nhiên có một phương pháp có vẻ triển vọng hơn.

Natural gradient descent (NGD)

SGD thông thường sẽ cập nhật $\theta$ bằng cách sử dụng Euclide metric, vốn không phù hợp trong không gian tham số. Trong khi đó, NGD sẽ tận dụng lợi thế của không gian tham số này.

Chưa viết tiếp …

Tài liệu tham khảo

[1] https://pennylane.ai/qml/glossary/parameter_shift.html

[2] Schuld, Maria, et al. “Evaluating analytic gradients on quantum hardware.” Physical Review A 99.3 (2019): 032331.

[3] Broughton, Michael, et al. “Tensorflow quantum: A software framework for quantum machine learning.” arXiv preprint arXiv:2003.02989 (2020).

[4] Mitarai, Kosuke, et al. “Quantum circuit learning.” Physical Review A 98.3 (2018): 032309.