Asterisk के वॉइस मेल को साकुरा के AI इंजन के साथ टेक्स्ट में बदलना

Asterisk के ARI का उपयोग करके, वॉइस मेल रिकॉर्ड किया और साकुरा के AI इंजन के Whisper API से इसे टेक्स्ट में बदलने का प्रयास किया।
ट्रांसक्रिप्शन किया गया सामग्री Slack पर सूचित की जाएगी।

पहले

Asterisk का सेटअप पहले से मौजूद था, इसलिए हम उसी का उपयोग कर रहे हैं।

ARI को सक्षम करना

Asterisk की सेटिंग फ़ाइल ari.conf को संपादित करें और ARI को सक्षम करें।

  • ari.conf
    [general]
    enabled = yes
    
    [asterisk]
    type = user
    read_only = no
    password = asterisk
    password_format = plain
    

Asterisk के HTTP सर्वर को भी सक्षम करें।

  • http.conf
    [general]
    servername=Asterisk
    enabled=yes
    bindaddr=127.0.0.1
    bindport=8088
    

इस बार, हम 999 नंबर पर आने वाली कॉल को वॉइस मेल के लिए सेट करेंगे।

  • extensions.conf
    [default]
    exten => 999,1,Wait(1)
      same => n,Stasis(rusudenkun)
      same => n,Hangup()
    

कार्य प्रवाह

  1. 999 नंबर पर कॉल आती है
  2. ARI एप्लिकेशन rusudenkun शुरू होता है
  3. वॉइस एनाउंसमेंट खेली जाती है
  4. रिकॉर्डिंग शुरू होती है
  5. रिकॉर्डिंग समाप्त होने पर, रिकॉर्ड की गई WAV फ़ाइल को साकुरा के AI इंजन के Whisper API से टेक्स्ट में बदलना
  6. ट्रांसक्राइब की गई सामग्री को Slack पर सूचित करना

इसलिए, मैंने Go में ARI एप्लिकेशन को सरलता से लागू करने का प्रयास किया।

वास्तव में कॉल करके देखें

999 नंबर पर कॉल करके देखें और वॉइस मेल में कुछ रिकॉर्ड करें।

root@asterisk:~# tail -f /var/log/rusudenkun.log
{"time":"2025-09-26T15:25:45.529096517+09:00","level":"INFO","msg":"StasisStart","channel":"1758867943.63"}
{"time":"2025-09-26T15:25:45.529204145+09:00","level":"INFO","msg":"Running app","channel":"1758867943.63"}
{"time":"2025-09-26T15:25:45.680639184+09:00","level":"INFO","msg":"playing announce","media":"sound:custom/rusuden"}
{"time":"2025-09-26T15:25:54.607939088+09:00","level":"INFO","msg":"announce finished"}
{"time":"2025-09-26T15:26:04.981533804+09:00","level":"INFO","msg":"completed recording"}
{"time":"2025-09-26T15:26:05.982012514+09:00","level":"INFO","msg":"recorded","path":"rusudenkun-1758867943.63.wav"}
{"time":"2025-09-26T15:26:06.69882038+09:00","level":"INFO","msg":"transcribed text","text":"वॉइस मेल का ऑडियो ट्रांसक्रिप्शन टेस्ट है वॉइस मेल का ऑडियो टेक्स्ट ट्रांसक्रिप्शन टेस्ट है"}

रिकॉर्ड की गई WAV फ़ाइल को /var/lib/asterisk/sounds/rusudenkun-<channel>.wav में सहेजा जाता है।
इस ऑडियो फ़ाइल को साकुरा के AI इंजन के Whisper API से टेक्स्ट में बदला जा रहा है।

Slack नोटिफिकेशन

सफलता से ट्रांसक्रिप्शन किया गया।

सारांश

  • Asterisk के ARI का उपयोग करके, वॉइस मेल ऑडियो को रिकॉर्ड करना संभव हुआ
  • रिकॉर्ड की गई WAV फ़ाइल को साकुरा के AI इंजन के Whisper API से टेक्स्ट में बदला जा सका
  • ट्रांसक्रिप्शन की गई सामग्री को Slack पर सूचित किया गया

ईमानदारी से कहूँ तो, मेरे घर के उपकरणों पर ज्यादा कॉल नहीं आते, इसलिए मुफ्त प्लान का 50 अनुरोध मेरे लिए पर्याप्त हो सकता है।