ಪ್ರಾಂಪ್ಟ್ ಇಂಜಿನಿಯರಿಂಗ್:ಭಾಗ-೨ -

ಕನ್ನಡದಲ್ಲಿ ಪ್ರಾಂಪ್ಟ್ ಇಂಜಿನಿಯರಿಂಗ್ ಕಲಿಯಿರಿ

GPT ಇಂದ Multimodal ವರೆಗೆ

ತಂತ್ರಜ್ಞಾನದ ಜಗತ್ತು ನಿಂತ ನೀರಲ್ಲ. ಇಂದು ನಾವು ಪ್ರಾಂಪ್ಟ್ ಇಂಜಿನಿಯರಿಂಗ್ ಬಗ್ಗೆ ಮಾತನಾಡುತ್ತಿದ್ದೇವೆ ಎಂದರೆ, ಅದಕ್ಕೆ ಮುಖ್ಯ ಕಾರಣ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಬೆಳೆದು ಬಂದ ಹಾದಿ. ಈ ಹಿಂದೆ ಕಂಪ್ಯೂಟರ್‌ಗಳು ಅಥವಾ AI ಕೇವಲ ನಾವು ಹೇಳಿದ ಲೆಕ್ಕಾಚಾರಗಳನ್ನು ಮಾತ್ರ ಮಾಡುತ್ತಿದ್ದವು. ಆದರೆ ಇಂದಿನ AI ಕವಿತೆ ಬರೆಯುತ್ತದೆ, ಚಿತ್ರ ಬಿಡಿಸುತ್ತದೆ, ಮತ್ತು ನಮ್ಮೊಂದಿಗೆ ಹರಟೆ ಹೊಡೆಯುತ್ತದೆ! ಈ ಮಾಂತ್ರಿಕ ಬದಲಾವಣೆ ಹೇಗೆ ಆಯಿತು?

ಇದನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲು ನಾವು ಮೂರು ಮುಖ್ಯ ತಾಂತ್ರಿಕ ಪದಗಳನ್ನು ಸರಳವಾಗಿ ತಿಳಿದುಕೊಳ್ಳಬೇಕು: LLM, GPT ಮತ್ತು Multimodal.

೧. ಬೃಹತ್ ಭಾಷಾ ಮಾದರಿ (Large Language Models – LLMs): ಇಂದಿನ ಬಹುಪಾಲು AI ತಂತ್ರಾಂಶಗಳು ಈ ‘LLM’ ಎಂಬ ತಂತ್ರಜ್ಞಾನದ ಮೇಲೆಯೇ ಕೆಲಸ ಮಾಡುತ್ತವೆ.

ನಿಮ್ಮ ಮೊಬೈಲ್ ಫೋನ್‌ನಲ್ಲಿ ವಾಟ್ಸಾಪ್ ಮೆಸೇಜ್ ಟೈಪ್ ಮಾಡುವಾಗ, ನೀವು ಒಂದೆರಡು ಅಕ್ಷರ ಟೈಪ್ ಮಾಡಿದ ತಕ್ಷಣ ಮುಂದಿನ ಪದ ಯಾವುದು ಬರಬಹುದು ಎಂದು ಮೊಬೈಲ್ ಊಹಿಸಿ ತೋರಿಸುತ್ತದಲ್ಲವೇ? LLM ಕೂಡ ಇದೇ ರೀತಿ ಕೆಲಸ ಮಾಡುತ್ತದೆ, ಆದರೆ ಇದು ನಿಮ್ಮ ಮೊಬೈಲ್‌ಗಿಂತ ಕೋಟ್ಯಂತರ ಪಟ್ಟು ಹೆಚ್ಚು ಬುದ್ಧಿವಂತ! ಇದು ಅಂತರ್ಜಾಲದಲ್ಲಿರುವ ಲಕ್ಷಾಂತರ ಪುಸ್ತಕಗಳು, ವಾರ್ತಾ ಪತ್ರಿಕೆಗಳು, ವಿಕಿಪೀಡಿಯಾ ಲೇಖನಗಳನ್ನು ಮೊದಲೇ ಓದಿ, ಭಾಷೆಯ ವ್ಯಾಕರಣವನ್ನು ಮತ್ತು ಮನುಷ್ಯರು ಹೇಗೆ ಮಾತನಾಡುತ್ತಾರೆ ಎಂಬುದನ್ನು ಕಲಿತಿರುತ್ತದೆ. ಹೀಗಾಗಿ ನಾವು ಪ್ರಶ್ನೆ ಕೇಳಿದಾಗ, ಅದಕ್ಕೆ ಸೂಕ್ತವಾದ ಉತ್ತರವನ್ನು ಪದಗಳ ರೂಪದಲ್ಲಿ ಪೋಣಿಸುತ್ತಾ ಹೋಗುತ್ತದೆ.

೨. GPT ಎಂದರೇನು? ನೀವು ‘ಚಾಟ್‌ಜಿಪಿಟಿ’ (ChatGPT) ಎಂಬ ಹೆಸರನ್ನು ಇತ್ತೀಚೆಗೆ ಎಲ್ಲೆಡೆ ಕೇಳಿರುತ್ತೀರಿ. ಇದರಲ್ಲಿರುವ ‘GPT’ ಎಂದರೆ Generative Pre-trained Transformer. ಈ ಇಂಗ್ಲಿಷ್ ಪದಗಳನ್ನು ಕೇಳಿ ಹೆದರಬೇಕಾಗಿಲ್ಲ, ಇದರ ಅರ್ಥ ಬಹಳ ಸರಳವಾಗಿದೆ:

Generative (ಸೃಷ್ಟಿಸುವ): ಹೊಸ ವಿಷಯವನ್ನು, ಅಂದರೆ ಕಥೆ, ಕವನ, ಅಥವಾ ನಮಗೆ ಬೇಕಾದ ಉತ್ತರವನ್ನು ತಾನೇ ಸ್ವತಃ ಸೃಷ್ಟಿಸುವ ಸಾಮರ್ಥ್ಯ.
Pre-trained (ಮೊದಲೇ ತರಬೇತಿ ಪಡೆದ): ಜಗತ್ತಿನ ಅಪಾರ ಮಾಹಿತಿಯನ್ನು ಶಾಲಾ ಮಗುವಿನಂತೆ ಮೊದಲೇ ಓದಿ, ಕಲಿತುಕೊಂಡು ಸಿದ್ಧವಾಗಿರುವುದು.
Transformer (ಟ್ರಾನ್ಸ್‌ಫಾರ್ಮರ್): ಇದು ವಾಕ್ಯದಲ್ಲಿರುವ ಪದಗಳ ನಡುವಿನ ಸಂಬಂಧವನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳುವ ಒಂದು ವಿಶೇಷ ತಂತ್ರಜ್ಞಾನ. ಉದಾಹರಣೆಗೆ, “ಬ್ಯಾಂಕ್” ಎಂಬ ಪದ ಬಂದರೆ, ಅದು ಹಣ ಇಡುವ ‘ಬ್ಯಾಂಕ್’ ಅಥವಾ ನದಿಯ ‘ದಡ’ (River bank) ಎಂಬುದನ್ನು ವಾಕ್ಯದ ಆಧಾರದ ಮೇಲೆ ಇದು ನಿಖರವಾಗಿ ಗ್ರಹಿಸುತ್ತದೆ.

೩. Multimodal AI (ಬಹು-ಮಾದರಿ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ): ಆರಂಭದಲ್ಲಿ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಕೇವಲ ಪದಗಳನ್ನು ಮಾತ್ರ ಅರ್ಥಮಾಡಿಕೊಳ್ಳುತ್ತಿತ್ತು. ನೀವು ಟೈಪ್ ಮಾಡಿ ಪ್ರಶ್ನೆ ಕೇಳಿದರೆ, ಅದು ಪದಗಳ ರೂಪದಲ್ಲಿ ಉತ್ತರ ಕೊಡುತ್ತಿತ್ತು.

ಆದರೆ ಈಗ AI ‘Multimodal’ ಆಗಿ ಬೆಳೆದಿದೆ. ‘Multi’ ಎಂದರೆ ಅನೇಕ, ‘Modal’ ಎಂದರೆ ಮಾಧ್ಯಮ. ಅಂದರೆ ಇಂದಿನ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆ ಕೇವಲ ಪದಗಳನ್ನಷ್ಟೇ ಅಲ್ಲ, ಚಿತ್ರಗಳನ್ನು, ಧ್ವನಿಯನ್ನು ಮತ್ತು ವೀಡಿಯೊಗಳನ್ನು ಕೂಡ ನೋಡಿ, ಕೇಳಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಲ್ಲದು!

ನೀವು ನಿಮ್ಮ ಮನೆಯ ಫ್ರಿಡ್ಜ್ ಒಳಗೆ ಇರುವ ತರಕಾರಿಗಳ ಒಂದು ಫೋಟೋ ತೆಗೆದು AI ಗೆ ಕಳುಹಿಸಿ, “ಇದರಲ್ಲಿರುವ ಸಾಮಗ್ರಿಗಳನ್ನು ಬಳಸಿ ರಾತ್ರಿಗೆ ಯಾವ ಅಡುಗೆ ಮಾಡಬಹುದು?” ಎಂದು ಕೇಳಿದರೆ, ಅದು ಆ ಫೋಟೋದಲ್ಲಿರುವ ಟೊಮೆಟೊ, ಕ್ಯಾರೆಟ್, ಬೀನ್ಸ್ ಅನ್ನು ತನ್ನ ‘ಕಣ್ಣಿನಿಂದ’ (ತಂತ್ರಜ್ಞಾನದಿಂದ) ಗುರುತಿಸಿ, ನಿಮಗೆ ಒಂದು ರುಚಿಯಾದ ಅಡುಗೆಯ ರೆಸಿಪಿಯನ್ನು ಬರೆದು ಕೊಡುತ್ತದೆ. ಇದುವೇ Multimodal ತಂತ್ರಜ್ಞಾನದ ಅದ್ಭುತ ತಾಕತ್ತು!

ಈ ರೀತಿ ಕೃತಕ ಬುದ್ಧಿಮತ್ತೆಯು ಕೇವಲ ಒಂದು ‘ಯಂತ್ರ’ವಾಗಿ ಉಳಿಯದೆ, ನೋಡುವ, ಕೇಳುವ ಮತ್ತು ನಮ್ಮಂತೆಯೇ ಯೋಚಿಸುವ ಮಟ್ಟಿಗೆ ಬೆಳೆದಿದೆ. ಯಂತ್ರಗಳು ಇಷ್ಟೊಂದು ಬುದ್ಧಿವಂತವಾಗಿರುವುದರಿಂದಲೇ, ಅವುಗಳ ಜೊತೆ ಸರಿಯಾದ ರೀತಿಯಲ್ಲಿ ಮಾತನಾಡಿ ಕೆಲಸ ಮಾಡಿಸಿಕೊಳ್ಳಲು ನಮಗೆ ‘ಪ್ರಾಂಪ್ಟ್ ಇಂಜಿನಿಯರಿಂಗ್’ ಎಂಬ ಕೌಶಲ್ಯ ಅತ್ಯಗತ್ಯವಾಗಿದೆ.

-ಅಜಿತ್.ಎಸ್
ಸಹಾಯಕ ಪ್ರಾಧ್ಯಾಪಕ
ಗಣಕ ವಿಜ್ಞಾನ ವಿಭಾಗ
ಎಸ್-ವ್ಯಾಸ ಡೀಮ್ಡ್ ಟು ಬಿ ವಿಶ್ವವಿದ್ಯಾಲಯ, ಬೆಂಗಳೂರು

Leave a Comment Cancel Reply