ערכתי לאחרונה בתאריך 23.06.05 בשעה 17:53 בברכה, Ken
אני בונה סוג של בוט שמקבל מידע ספציפי הנמצא בדרך כלל באמצע עמוד HTML.
אני מנסה כמה שיותר לצמצם את המידע שאני מקבל בכל סריקה.
עמוד HTML מלא הוא בערך 80KB. המידע שאני צריך הוא בערך 1-2KB - וכפי שאמרתי נמצא בערך באמצע עמוד.תחילה ניסיתי בעזרת Range: Bytes=1000-2000 (סתם ערך לדוגמה).
אבל הדבר פועל כמעט ואך ורק עבור קבצי תמונה או exe ולא עמודי אינטרנט.
לאחר מכן גילתי שיש שרתים שתומכים בכיווץ gzip או deflate, אך מספרם מצומצם.
אני מנסה כמה שיותר לכווץ את החלק הראשון של העמוד, שהרי הוא מידע מיותר עבורי.
החלק השני של העמוד הוא לא בעיה, אפשר פשוט לנתק את התקשורת לאחר שהתקבל המידע המבוקש.
חשבתי אולי אם יש דרך לקבל את העמוד בצורה רק של טקסט (ללא תגיות HTML) זה יהיה מעולה - אך אני לא יודע אם זה אפשרי.
תעזרו לי למצוא פתרונות נוספים...
תודה מראש,
KeN