कंटेंट क्रिएटर्स के लिए वॉयस-ओवर को आसान बना रहा है दिल्ली का यह स्टार्टअप
अनंत त्रिपाठी, चक्रपाणि मिश्रा और दिवाकर चोपड़ा का मानना था कि कंटेन्ट क्रिएशन की दुनिया में वॉयस-टू-टेक्स्ट और टेक्स्ट-टू-वॉयस अनिवार्य होगा। यह आवश्यकता कोरोना महामारी के दौरान और अधिक प्रमुख हो गई थी।
अनंत एक आईआईटी खड़गपुर के छात्र रहे हैं, चक्रपाणि आईआईटी बॉम्बे से हैं और दिवाकर ने अमेरिका की पर्ड्यू यूनिवर्सिटी से स्नातक किया है। इन दोस्तों अपने कॉलेज के दिनों से स्पीचमैक्स शुरू करने का फैसला कर लिया था। दिल्ली-एनसीआर का यह स्टार्टअप कंटेंट क्रिएटर्स के लिए हिंदी और अंग्रेजी में फ्री वॉयस-ओवर जेनरेट करता है।
अन्य टेक्स्ट-टू-स्पीच प्लेटफॉर्म जहां वॉयस-ओवर रोबोटिक ध्वनि के साथ करते हैं, स्पीचमैक्स में सभी आवाजें प्राकृतिक और मानव जैसी लगती हैं। एआई और नैचुरल लैंग्वेज प्रोसेसिंग का लाभ उठाते हुए स्पीचमैक्स बहुत रियलिस्टिक वॉयस-ओवर उत्पन्न करने में मदद करता है, जिसका उपयोग विभिन्न प्रकार के कंटेन्ट में किया जा सकता है, जिसमें ऑडियोबुक, डॉक्यूमेंट्री, वीडियो आदि शामिल हैं।
स्टार्टअप क्या करता है?
अनंत बताते हैं कि स्पीचमैक्स पारंपरिक तौर पर लगने वाले लंबे समय को कुछ मिनटों तक लाकर वॉयस-ओवर बनाने की परेशानी को दूर करता है। स्पीचमैक्स के प्लेटफॉर्म पर कंटेन्ट क्रिएटर्स कुछ ही क्लिक के साथ एक स्क्रिप्ट को स्टूडियो-गुणवत्ता वाले मानव-जैसे वॉयस ओवर में बदल सकते हैं। स्टार्टअप उत्पादन गुणवत्ता को बनाए रखते हुए आर्टिस्ट के लिए समय और लागत कम करने में मदद करता है।
अनंत कहते हैं,
“स्पीचमैक्स पर वॉयस विभिन्न भाषाओं और वॉयस-ओवर शैलियों में पेशेवर वॉयस-ओवर कलाकारों के एआई अवतार हैं। वीडियो और ऑडियो कंटेन्ट क्रिएटर हमारे मंच का उपयोग अपनी चुनी हुई स्क्रिप्ट और शैली में वॉयस-ओवर बनाने के लिए करते हैं।”
वॉयस-ओवर जनरेशन प्लेटफॉर्म विभिन्न प्रकार की आवाजों और वर्णन शैलियों पर लोकप्रिय हो रहा है। वर्तमान में, स्पीचमैक्स के पास अलग-अलग वॉयस-ओवर शैलियों के साथ तीन वॉइस आर्टिस्ट हैं। यूजर्स एक आर्टिस्ट और शैली का चयन कर सकते हैं और एक स्क्रिप्ट प्रदान कर सकते हैं, जो कुछ ही सेकंड में ऑडियो में परिवर्तित हो जाती है। वे एक ऑडियो एडिटर का उपयोग करके उत्पन्न ऑडियो को और रिफ़ाइन कर सकते हैं और अंतिम ऑडियो फ़ाइल को एमपी3 प्रारूप में एक्सपोर्ट किया जा सकता है।
अनंत कहते हैं,
"वास्तव में वे डिजिटल उपभोग के लिए वीडियो सामग्री बना सकते हैं क्योंकि उनमें से अधिकांश सोशल मीडिया पर अपनी क्रिएशन को होस्ट करते हैं। जल्द ही हम स्पीचमैक्स को वॉयस-ओवर आवश्यकताओं को पूरा करने के लिए एक वैश्विक मंच बनाने के लिए नई आवाजें, स्थानीय और विदेशी भाषाएं जोड़ेंगे।"
उन्होंने आगे कहा,
“हम कंटेंट क्रिएटर्स को पावर देना चाहते हैं। हम मॉनेटाइजेशन की एक फ्रीमियम रणनीति का पालन करते हैं। आप स्पीचमैक्स को मुफ्त में आज़मा सकते हैं और यहां तक कि किसी भी उपयोग के लिए ऑडियो डाउनलोड कर सकते हैं।”
हालाँकि, स्टार्टअप के लिए यह सब करना सहज नहीं था।
मालिकाना तकनीक
एक मशीन का उपयोग करके ऑडियो जेनेरेशन जिसे पारंपरिक रूप से टेक्स्ट-टू-स्पीच कहा जाता है, यह लंबे समय से अस्तित्व में है। लेकिन मशीन से उत्पन्न ऑडियो की गुणवत्ता हमेशा से कमतर थी।
अनंत बताते हैं,
"स्पीचमैक्स ने इस खेल को बदल दिया है। स्टार्टअप की मालिकाना तकनीक अत्याधुनिक एआई के साथ है जो न केवल प्राकृतिक मानव-समान भाषण उत्पन्न करती है बल्कि मिमिक भी कर सकती है। इसलिए स्पीचमैक्स पर बनाया गया वॉयस-ओवर इतना स्वाभाविक लगता है।”
स्टार्टअप ने एक जैकपॉट मारा जब उसके मालिकाना एआई मॉडल ने वास्तविक मानव-रिकॉर्ड किए गए ऑडियो से लगभग अप्रभेद्य ऑडियो का उत्पादन किया।
अनंत कहते हैं,
"हमने महामारी के बीच में तकनीक विकसित की जिसने डिजिटल कंटेन्ट निर्माण के लिए लोगों के जीवन को मौलिक रूप से स्थानांतरित कर दिया और हमारे उत्पाद की मांग को बढ़ा दिया।"
उन्होंने आगे कहा,
"अधिक से अधिक कंटेन्ट क्रिएटर्स उत्पादन के लिए डिजिटल समाधान का उपयोग करते हैं। हमारी तकनीक सामग्री निर्माताओं और उद्यमों को बड़े पैमाने पर वॉयस-ओवर बनाने के समाधान की तलाश में पूरी तरह सक्षम बनाती है।"
वर्तमान में स्पीचमैक्स की टीम में 10 सदस्य हैं।
बाजार और भविष्य
मार्केट्स एंड मार्केट्स की रिपोर्ट के अनुसार टेक्स्ट-टू-स्पीच मार्केट का मूल्य 2020 में 2 बिलियन डॉलर था, जो 2026 तक 5 बिलियन डॉलर तक पहुंचने का अनुमान है। इस सेगमेंट में 2020 और 2026 के बीच 14.6 प्रतिशत का सीएजीआर देखा जाएगा।
दिल्ली-एनसीआर का यह स्टार्टअप ओटर.एआई, साउंडहाउंड और ज्ञानी.एआई जैसे प्लेटफार्मों के साथ प्रतिस्पर्धा करता है।
अपनी स्थापना के बाद से बूटस्ट्रैप्ड स्पीचमैक्स जल्द ही अन्य स्थानीय भाषाओं में भी शुरू होगा।
अनंत कहते हैं,
“हम उत्पाद को और विकसित करते हुए अपनी पहुंच को और अधिक भौगोलिक क्षेत्रों तक विस्तारित करना चाहते हैं। हमारी योजनाओं में विदेशी भाषाओं को जोड़ना भी शामिल है। हम स्पीचमैक्स पर वॉयस-ओवर कलाकारों का बाज़ार भी बनाना चाहते हैं। स्पीचमैक्स के लिए हमारा विजन वॉयस ओवर आवश्यकताओं के लिए इसे वन-स्टॉप समाधान बनाना है।”
Edited by Ranjana Tripathi