शब्दतंत्र अँगरेज़ी भाषा के लिए एक शाब्दिक डेटाबेस है। यह अँगरेज़ी शब्दों को समानार्थी शब्दों के वर्गों के समूह बनाता है जिसे समानार्थी-शब्दों का समूह भी कहा जाता है, संक्षिप्त, सामान्य परिभाषा प्रदान करता है, और इन समानार्थी शब्द वर्गों के बीच विभिन्न शब्दार्थ विज्ञान संबंध रिकॉर्ड करता है। उद्देश्य दुगना है: शब्दकोश और पर्याय शब्दकोश के संयोजन का निर्माण करना जोकि सहज ज्ञान से अधिक प्रयोग करने , और स्वत: पाठ विश्लेषण और कृत्रिम बुद्धि अनुप्रयोगों का समर्थन करने के लिए योग्य है। डेटाबेस और सॉफ्टवेयर उपकरण निःशुल्क डाउनलोड और प्रयोग किए जा सकते हैं । डेटाबेस को ऑनलाइन भी देख सकते हैं।
डेटाबेस विषय-वस्तु
डेटाबेस में संक्षिप्त रूप में शब्द-अर्थ-युग्मों की कुल संख्या; के लिए समानार्थी शब्द-वर्गों में शब्द व्यवस्थित हैं।
शब्दतंत्र संज्ञा, क्रिया, विशेषण और क्रियाविशेषण के बीच भेद निकालता है क्योंकि वे अलग व्याकरण के नियमों का पालन करते हैं। प्रत्येक समानार्थी शब्द-वर्ग में समानार्थी-शब्द या विन्यास (विन्यास, शब्दों का क्रम है जोकि विशेष अर्थ रूप बनाने के लिए एक साथ जाते हैं)के समूह सम्मिलित हैं, शब्द के अलग अलग अर्थ अलग अलग समानार्थी शब्द-वर्ग में हैं।
अधिकतम समानार्थी शब्द-वर्ग अन्य समानार्थी शब्द-वर्गों शब्दार्थ विज्ञान संबंधों के माध्यम से जुड़े हैं। ये संबंध शब्द के प्रकार के आधार पर भिन्न होते हैं, और इसमें सम्मिलित हैं:
संज्ञा
क्रिया
विशेषण
संबंधित क्रिया
क्रिया विशेषण
मूल विशेषण
जबकि शब्दार्थ-विज्ञान-संबंध समानार्थी-शब्द-वर्ग के सभी सदस्यों पर लागू होते हैं क्योंकि वे अर्थ प्रदान करते हैं लेकिन सब परस्पर समानार्थी शब्द हैं, शब्द भी शाब्दिक संबंधों विलोम शब्द (एक दूसरे के विपरीत) सहित, के माध्यम से अन्य शब्दों से जोड़े जा सकते हैं, जो धातु रूपी संबंधित हैं।
शब्दतंत्र शब्द की सभी गुण की संख्या को प्रदान कराता है: समानार्थी-शब्द-वर्गों की संख्या में शब्द होता है। यदि कोई शब्द कई समानार्थी-शब्द-वर्गों (अर्थात् जिसके कई अर्थ हैं) में भाग लेता है तो सामान्यतः कुछ अर्थ दूसरों की तुलना में अधिक साधारण होते हैं। शब्दतंत्र आवृत्ति स्कोर द्वारा इसे परिमाणित करता है: जिसमें कई नमूना पाठों में सारे शब्द अनुरूपी समानार्थी-शब्द-वर्गों के साथ अर्थ की दृष्टि से चिन्हित होते हैं, और फिर गणनांक प्रदान किया जाता है जो विशेष अर्थ में कितनी बार शब्द का प्रकट होना बताता है।
सॉफ्टवेयर के आकृति विज्ञान कार्य उपयोगकर्ता के इनपुट से शब्द के लैमा या मूल रूप की उत्पत्ति का पता करने के लिए डेटाबेस के साथ वितरित किए जाते हैं, केवल मूल रूप डेटाबेस में संग्रहीत है जब तक कि इसमें अनियमित बदले हुए शब्दरूप न हो।
समस्याएँ और सीमाएं
अन्य शब्दकोशों से भिन्न, शब्दतंत्र शब्द व्युत्पत्ति विज्ञान, उच्चारण और अनियमित क्रिया रूपों के बारे में जानकारी को शामिल नहीं करता है और उपयोग के बारे में केवल सीमित जानकारी शामिल करता है। वास्तविक शब्दकोशीय और शब्दार्थ विज्ञान जानकारी कोशकार की फ़ाइलों में बनी रखी होती हैं, जो फिर एक उपकरण द्वारा संसाधित किया जाता है जिसे वितरित डेटाबेस के उत्पादन के लिए काम में लाया जाता है। दोनों काम में लाई गई और कोशकार फ़ाइलें आसानी से एक अलग वितरण में उपलब्ध हैं, लेकिन डेटाबेस को संशोधित करने और बनाए रखने की विशेषज्ञता की आवश्यकता है।
हालांकि शब्दतंत्र में आम शब्दों की एक पर्याप्त विस्तृत अनुक्रम हैं, यह विशेष डोमेन शब्दावली को समाविष्ट नहीं करता है। क्योंकि यह मुख्य रूप से विभिन्न अनुप्रयोगों के लिए एक अंतर्निहित डेटाबेस के रूप में कार्य के लिए बनाया गया है, वे अनुप्रयोगों विशिष्ट डोमेन में प्रयोग नहीं किए जा सकते हैं जोकि शब्दतंत्र द्वारा समाविष्ट नहीं किए जाते हैं।
शब्दतंत्र का प्रयोग शब्द अर्थ बहुविकल्पी (डब्ल्यूएसडी) के लिए अँगरेज़ी के संगणकीय शब्दकोश में सबसे अधिक किया जाता है, विषय में शब्दों के सबसे उपयुक्त अर्थों को बताने का उद्देश्य होता है। हालांकि, यह तर्क दिया है कि शब्दतंत्र अर्थ भेद का कूटलेखन करता है जोकि मानव के लिए काफी उपयोगी है।
अनुप्रयोग
शब्दतंत्र सूचना प्रणाली में विभिन्न प्रयोजनों की संख्या के लिए प्रयोग किया गया है, जिसमें शब्दार्थ बहुविकल्पी, सूचना पुनर्प्राप्ति, स्वत: पाठ वर्गीकरण, स्वत: पाठ संक्षिप्तीकरण, और स्वत: वर्ग-पहेली उत्पादन भी शामिल है।
शब्दतंत्र के उपयोग का एक अन्य प्रमुख उदाहरण शब्दों के बीच समानता को निर्धारित करना है। विभिन्न एल्गोरिदम प्रस्तावित किए गए हैं, और इनमें शब्दों की वैचारिक श्रेणियों के बीच की दूरी को देखते हुए, साथ ही साथ शब्दतंत्र वस्तुरूप विज्ञान की सौपानिक संरचना पर विचार करते हुए शामिल हैं।
डॉ. काजल बाजपेयी
संगणकीय भाषावैज्ञानिक
एएआई ग्रुप, सी-डैक, छठवाँ फ्लोर
एनएसजी आईटी पार्क, औंध, पुणे, महाराष्ट्र
kajaldelhi2001@gmail.com


![Validate my Atom 1.0 feed [Valid Atom 1.0]](valid-atom.png)