Apache PDFBox

البرمجيات قطة:
Apache PDFBox
تفاصيل البرنامج:
الإصدار: 2.0.0 محدث
تاريخ إيداع: 9 Apr 16
المطور: Ben Litchfield
ترخيص: حرر
شعبية: 145

Rating: nan/5 (Total Votes: 0)

وهذا المشروع سوف تسمح بالوصول إلى كافة المكونات في وثيقة PDF من داخل تطبيقات جافا.

وFontBox وJempBox متوفرة أيضا للتحميل

ما هو الجديد في هذا الاصدار:.

يجب أن يتم نقل المنطق OverlayPDF في فئة مكتبة
الخطأ تحميل الوثيقة عن وثيقتين RegisSTAR
TestFilters هو غير القطعية
PDFCloneUtility لا يعالج COSStreamArray
يجب RubberStampWithImage دعم المزيد من أنواع الصور
جعل TestImageIOUtils اختياري في 1.8 لفيدورا التعبئة والتغليف
دعم المشاجرات متعددة الصفحات في CCITTFactory، يجعل PDFBox قادرة على القيام tiff2pdf
وأضاف PDFBox الإصدار إلى عنوان
COSDocument وPDDocument يعلن يلقي IOException عندما لا
وأضاف وحدة اختبار لRandomAccessFileOutputStream

ما هو الجديد في النسخة 1.8.9:

يجب أن يتم نقل المنطق OverlayPDF في فئة مكتبة
الخطأ تحميل الوثيقة عن وثيقتين RegisSTAR
TestFilters هو غير القطعية
PDFCloneUtility لا يعالج COSStreamArray
يجب RubberStampWithImage دعم المزيد من أنواع الصور
جعل TestImageIOUtils اختياري في 1.8 لفيدورا التعبئة والتغليف
دعم المشاجرات متعددة الصفحات في CCITTFactory، يجعل PDFBox قادرة على القيام tiff2pdf
وأضاف PDFBox الإصدار إلى عنوان
COSDocument وPDDocument يعلن يلقي IOException عندما لا
وأضاف وحدة اختبار لRandomAccessFileOutputStream

ما هو الجديد في النسخة 1.8.8:

يجب أن يتم نقل المنطق OverlayPDF في فئة مكتبة
الخطأ تحميل الوثيقة عن وثيقتين RegisSTAR
TestFilters هو غير القطعية
PDFCloneUtility لا يعالج COSStreamArray
يجب RubberStampWithImage دعم المزيد من أنواع الصور
جعل TestImageIOUtils اختياري في 1.8 لفيدورا التعبئة والتغليف
دعم المشاجرات متعددة الصفحات في CCITTFactory، يجعل PDFBox قادرة على القيام tiff2pdf
وأضاف PDFBox الإصدار إلى عنوان
COSDocument وPDDocument يعلن يلقي IOException عندما لا
وأضاف وحدة اختبار لRandomAccessFileOutputStream

ما هو الجديد في النسخة 1.8.1:

علة المآزق:
تتلقى الدرجة PDGraphicsState حجة صفحة فارغة مما يؤدي إلى NPE
مضمون الشرح غير مرئية في الصورة (تحويل من PDF)
TextPosition.getX () وغيتي () لا تعمل بشكل صحيح مع CropBox
TTFSubFont يولد الخطوط الصناديق الفرعية المعرضة للعلة الشد بعض الطابعات
دمج ملفات PDF مع نماذج تفاعلية يؤدي إلى PDF الفاسدين
حفظ مستند يحتوي على شكل XFA يخلق الشعبي غير صالح
NonSequentialPDFParser بشكل غير صحيح تحليل معلومات وثيقة
يجب إزالة الطبقة PDSignature غير المستخدمة
خطأ عند استخدام خطوط أحادي المسافة

ما هو الجديد في النسخة 1.7.1:

تغيير باستثناء ملفوفة تمديد استثناء وتمرير استثناء التفاف لأكثر القياسية / المطبوعة أفضل من الاستثناءات ملفوفة
تحليل فقط تيارات الكائن إذا يتم الرجوع إليها من قبل الجدول XREF / تيار
تيار إعراب BaseParser أن يرتد إلى مسح إذا كانت القيمة طول خاطئة
تقليل استهلاك الذاكرة من RandomAccessBuffer

ما هو الجديد في النسخة 1.7.0:

فك كجك
إدماج PDF / A المدقق في PDFBox
تنفيذ نوع 4 وظائف (PDFunctionType4)
تحويل لون PDJpegs باستخدام فضاء لوني DeviceN
واضاف ومثل؛ حفظ كصورة ومثل. لPDFReader
السماح شاء subclasses ترث من PDFParser
واضاف الدعم لينبئ عن بداية و / أو صفحة النهاية عندما تقسيم PDF
دعم CIDToGIDMap الخطوط CID-TYPE2
انقسام PDFont # ترميز

ما هو الجديد في النسخة 1.6.0:

التحسينات:
واجهة توقيع PDF والتحسينات
لا يمكن استخراج ب / ث الصور من PDF
إنشاء مقاييس الخط Type1C إلا عند الضرورة
تخطي PS XObjects بدلا من رمي استثناء
إضافة إخراج التصحيح اختياري لExtractText
لا لزوم لها ملء مجموعة جديدة مع الأصفار في RandomAccessBuffer :: الكتابة ([] بايت، الباحث، الباحث)
لا لزوم لها باستخدام ByteArrayInputStream وسيطة لنسخ من إعطاء صفيف بايت إلى OutputStream في FlateFilter :: فك
إزالة imageIO التبعية (كان: PDPage convertToImage علة يخلق صورا بيضاء من قوات الدفاع الشعبي الملفات السوداء والبيضاء).
تحسن توقيع (القابل للتعيين حجم توقيع)
نسخة PDF لا يقرأ في كتالوج وثيقة
وحدة الاختبارات لميزات PDFBox
علة المآزق:
لا يتم وضع الصور بالتناوب وتقديم بشكل صحيح أثناء تحويل صفحات PDF إلى صور
يبدو استنساخ -convertToImage لعكس الألوان
تحويل إلى صورة يجعل صورة فارغة
PDF 2 المشاجرة تحويل لا يحدث بشكل صحيح
RandomAccessBuffer بإرجاع قيم خاطئة ليقرأ بايت واحد، والتصحيح تعلق

ما هو الجديد في النسخة 1.5.0:

التحسينات:
PDFDocument.save بطيء حقا
قراءة ملفات PDF غير المطابقة (المرفقة) دون رمي ...
وأضاف حماية NPE التي وقعت عند قراءة ملفات PDF الفاسدة
تجنب استخدام الملفات المؤقتة في PDJpeg
لا تستخدم temporty الملفات بشكل افتراضي لجميع الأحجام PDF
علة المآزق:
خطأ في استخراج النص: java.lang.IndexOutOfBoundsExceptio
PDFTextStripper ليس التعامل مع بعض اليابانيين
NPE NullPointerException في PDPageNode.getCount
CFFParser.readCharset java.lang.IllegalArgumentException
فشل في إنشاء الخط Type1C. يتراجع إلى Type1 الخط
PDFont فشل لإغلاق ملف الخط.
NPE في PDPageNode
فشل PDFStreamEngine.processEncodedText على UTF-16 النص
ExtractText الشعبي الصين، ولكن pdfbox يميز كوريا، و...
النص لا المستخرجة مع PDFBox 1.4
النص استخراج الخطأ باستخدام PDFBox 1.4
الفراغات خسر عند استخراج النص العربي
استخراج الأحرف اليابانية يعطي القمامة
تحسينات على جودة الصورة
PDFBOX قد لا تعتمد على الترميز plattform
RandomAccessBuffer فهذه أن تنشأ فارغة
ExtractText يعود غير المرغوب فيه
طريقة getParent من الدرجة PDField لا تعتبر على حد سواء ...
استخراج النص بطيئة و/ تمة يملأ upwith ملفات الهجوم الجوي الخط
لاغية مؤشر استثناء عندما الشرح يفتقد نوع الاشتراك

ما هو الجديد في النسخة 1.3.1:

ميزات جديدة:
إدارة البحث الجنائي لرسم الخرائط يونيكود
البحث ترميزات في FontFile3 - تنسيق CompactFont
إضافة طبقة الأداة المساعدة لاستخراج بسهولة مجموعة من الصفحات من PDF
PDFToImage: إضافة القدرة على تحديد منطقة لتصدير ...
إضافة WriteDecodedDoc إلى التطبيق مستقل
تحسينات:
ملفات CMAP الإضافيون من أدوبي
التعامل مع الصور JPEG2000 عبر فلتر JPXDecode
يرجى استيعاب '-' حيث من المتوقع عددا
تنفيذ تنسيقات CMAP إضافية للخطوط تروتايب
الوصول إلى مفاتيح الفوقية في نموذج PD
تحديث / ضبط تستخدم نسخة junit
تحديث / تنشيط بناء النمل
كائنات من تيارات الكتابة الأجسام قرأت بالفعل مع ..
مقبض أفضل من ملفات PDF المواصفات
إضافة القدرة على تجاهل أخطاء مع AcroForms
PDPixelMap هو مطول جدا
تحسين التعامل مع الفاسدين / عداد المفقودين الأعلام ٪٪ EOF في نهاية ملف
تحسن التعامل مع البيانات erronous بين endstream و...
إزالة الاعتماد على PageDrawer من النص المشغلين فقط
دعم TIFF مؤشرا 2 مع FlateDecode، وشملت التصحيح
زيادة أداء ColorSpaceCMYK.toRGB، والتصحيح تعلق
علة المآزق:
مشاكل مع استخراج النص وتشكل الوثائق البولندية.
الصور الملونة فهرستها لها ألوان خاطئة بعد التشفير
استثناء في استخراج النص
PDFMergerUtility قد خلق أسماء الحقول AcroForm غير فريد
Somtimes، TextPosition لها قيمة غير صحيحة ..
استخراج النص يجرد 1 شار عند استخراج زوج التوأم
النص غير صحيح Exolab.pdf في الانحدار اختبار
أنتجت النص غير لائق اعتمادا على الخط ...
PDFBox لا يمكن تحليل وثائق PDF من jstor.org
فشل testextract على لينكس وماك OS X
مشاركة الأحرف في تداخل خط عند طباعة PDF
جعل النص غير صالح أثناء طباعة PDF
، وضع إعادة شغل خصائص PDDocumentInformation لا ...
EXCEPTION_ACCESS_VIOLATION في fontmanager.so/fontmanager.dll
لا يعمل تنفيذ PDChoiceField من SetValue ...
CMAP محلل لا يعمل لتعيينات مزدوجة البايت مع ...
PrintPDF لا يأخذ الطابعة الافتراضية ويندوز ...
الخطأ عن طريق استخراج النص
استخراج النص من قوات الدفاع الشعبي ولدت من فشل مايكروسوفت وورد
scratchfile تجاهلها في الحمل PDDocument (ملف ملف، ...
نص أسكي Extratced في الوثيقة كجك تالف
PDTrueTypeFont.loadTTF () يجمد (في TTFDataStream.java:195)
مشكلة في استخراج أرقام الصفحات الرومانية [PDPageLabels.java]
ClassCastException: COSInteger لا يمكن أن يلقي لCOSDictionary
PDFont.getEncodingManager لا خيط المأمونة؛ FIX شملت
معالجة الخطأ من تنبئ PNG مع FlateDecode، والتصحيح ...
غموض خاطئة للصور مع لون الفضاء مفهرسة
المساحات تختفي وتحول النص اليسار
IIOException: خطأ 2 عند عرض PDF التي تحتوي على CCITT ...
فشل Write2File لPDCalRGB
استخدام COSName ثابت بدلا من COSString
الخط علامات تغير في الصوت مشكلة حجم الحساب
[pdfbox التطبيق] مشكلة مخضرم-حزمة من التكوين
وثائق: مثال بارز لديه خارج من تاريخ اسم الفئة
لا يتم تحميل ملفات AFM
يمزج TextExtraction حالة النص
PageDrawer لا يأخذ CropBox الكامل في الاعتبار
تحديد الترميز القياسي ل14 الخطوط القياسية
تلف الصور المفهرسة في بعض الأحيان عندما تشفير PDF
OutOfMemoryError في اختبارات استخراج النص

برامج مماثلة

Atom.js
Atom.js

5 Jun 15

jParser
jParser

5 Jun 15

Boris
Boris

13 May 15

docReady
docReady

13 Apr 15

تعليقات ل Apache PDFBox

لم يتم العثور على التعليقات
إضافة تعليق
بدوره على الصور!
البحث حسب الفئة