DSTK - مجموعة أدوات علوم البيانات 3 عبارة عن مجموعة من برامج استخراج البيانات والنص ، تتبع نموذج CRISP DM. يوفر DSTK فهم البيانات باستخدام التحليل الإحصائي والنص ، وإعداد البيانات باستخدام التطبيع ومعالجة النصوص ، والنمذجة والتقييم للتعلم الآلي وخوارزميات التعلم الإحصائي.
سوف تقدم DSTK 3 ميزات جذابة مثل Deep Neural Network (Deep Learning) ، تحليل ارتباط النص مع المرئيات ، تجمع KMeans. قد يتم تقديم بعض هذه الميزات في الإصدار القديم ، ولكن نظرًا لأنه تتم إعادة كتابة الخوارزميات لتقليل استخدام المكتبات الخارجية مثل Weka لتقليل حجم الملف ، فنحن بحاجة إلى المزيد من الوقت لتطويرها. محرك DSTK لا يزال في مرحلة تجريبية ، وبالتالي ، قد يكون هناك بعض الأخطاء وعدم الدقة.
يتكون DSTK 3 من DSTK Engine و DSTK ScriptWriter و DSTK Studio و DSTK Text Explorer. محرك DSTK هو R مبسطة ، مع التركيز على بيانات التعدين. يوفر DSTK ScriptWriter واجهة المستخدم الرسومية لكتابة البرنامج النصي لمحرك DSTK. يقدم DSTK Studio إحصائيات SPSS مثل واجهة المستخدم الرسومية لتنقيب البيانات ، ويقدم مستكشف نص DSTK واجهة المستخدم الرسومية للتعدين النص.
المتطلبات:
بيئة تشغيل جافا ، Microsoft. Net Framework
القيود:
10-الاستخدام التجريبي
لم يتم العثور على التعليقات