ويمكن أن تستخدم في كتابة الزواحف البحث (العناكب) أن صفحات الويب منجم للحصول على المعلومات المختلفة.
PHPCrawl تستحوذ على معلومات تم تكوينه لجلب ويمررها إلى تطبيقات أكثر قوة لمزيد من المعالجة
الميزات:.
مرشحات للURL ونوع المحتوى البيانات
تحديد سبل التعامل مع الكوكيز
تحديد سبل للتعامل مع ملفات robots.txt
الحد من نشاطها بطرق مختلفة
وسائط متعددة تجهيز
ما هو الجديد في هذا الإصدار:
البق الثابتة:
الروابط التي يتم urlencoded جزئيا وجزئيا لا تحصل على إعادة بناء / المشفرة بشكل صحيح الآن.
إزالة var_dump التصحيح غير ضرورية () من PHPCrawlerRobotsTxtParser.class.php
خادم الاسم إشارة في TLS / SSL يعمل بشكل صحيح الآن.
ومثل، قاعدة أ href ومثل، -tags في الحصول على تفسير المواقع بشكل صحيح الآن مرة أخرى.
ما هو الجديد في الإصدار 0.80 بيتا:
وقد ريفاكتوريد كود تماما، استدار إلى PHP5-OO-رمز وتم إعادة كتابة الكثير من التعليمات البرمجية.
وأضاف القدرة على استخدام استخدام عدة عمليات العنكبوت موقع على شبكة الانترنت. طريقة ومثل، goMultiProcessed () ومثل. تم الاضافة.
طريقة جديدة للتجاوز ومثل، initChildProcess () ومثل. وأضاف لبدء العمليات-الطفل عند استخدام الزاحف في متعدد عملية الوضع.
Implementet بديل، سكليتي الداخلي التخزين المؤقت من آلية لعناوين المواقع مما يجعل من الممكن العنكبوت مواقع كبيرة جدا.
طريقة ومثل، setUrlCacheType () ومثل. تم الاضافة.
طريقة جديدة setWorkingDirectory () وأضاف لتحديد موقع الزواحف العمل-دليل مؤقت يدويا. لذلك طريقة ومثل، setTmpFile () ومثل. تم وضع علامة على إهمال (لا يوجد لديه وظيفة بعد الآن).
طريقة جديدة ومثل، addContentTypeReceiveRule () ومثل. يستبدل طريقة والقديمة مثل، addReceiveContentType () ومثل ؛.
وظيفة ومثل، addReceiveContentType () ومثل. هو الحاضر لا يزال، ولكن تم وضع علامة على أنه إهمال.
المتطلبات:
PHP 5 أو أعلى
PHP مع دعم بينسل
لم يتم العثور على التعليقات