والعديد من التطبيقات التي تتعامل مع البيانات غير المهيكلة تتطلب الوصول إلى محتوى النص من وثائق مهيأ أو المرمز. المنظمات التي أرشفة الوثائق وغالبا ما تتطلب الوصول إلى المحتوى النصي لجعل الوثائق للبحث وتمكين المحتوى تجميع وإعداد التقارير والتعدين المحفوظات وثيقة. بحث ويحتاج تطبيق استرجاع أيضا لاستخراج وtokenize النص من مختلف صيغ الملفات.
وتقدم واحد آلية موحدة للوصول إلى واستخراج النص من الوثائق التي يفيلتر المكونات في واجهة المستخدم في محركات البحث مايكروسوفت. هناك عدد قليل من تطبيقات يفيلتر التي طورتها مايكروسوفت والشركات الأخرى التي تغطي مجموعة متنوعة من تنسيقات الملفات. جودة قياسية أو الموثوقية والنص استخراج تتباين متعددة المطورين يفيلتر.
مرشحات نص Opait هو برنامج صغير فائدة مع واجهة بسيطة لIFilters التي تم تثبيتها بالفعل على الكمبيوتر المضيف فضلا عن عدد قليل من نص مخصص المرشحات استخراج والتي تعمل مباشرة مع تنسيقات الملفات وتحسين بناء على تطبيقات يفيلتر الافتراضية.
يتم توفير واجهة لاستخراج النص من قبل مكتبة فئة صغيرة تسمى Opait.Filters التي يتم تضمينها، ويمكن استخدامها لدمج الفلاتر النص في التطبيقات. NET
المتطلبات:.
. NET الإطار 4.5
لم يتم العثور على التعليقات