ImageVenue hat sich erneut verändert:
- Die URIs können noch dieselben alten sein, wie z.B.:
- Code: Alles auswählen
http://img276.imagevenue.com/img.php?image=35501_Alessandra_Torresani_8th_Annual_BAFTALA_TV_Tea_Party_012_122_233lo.jpg
http://img175.imagevenue.com/img.php?image=38142_Tricia_Helfer_at_8th_Annual_BAFTA_LA_TV_Tea_Party_1_122_402lo.jpg
- Jene werden aber auf neuere URIs umgelenkt - in den Fällen:
- Code: Alles auswählen
https://www.imagevenue.com/view/o/?i=35501_Alessandra_Torresani_8th_Annual_BAFTALA_TV_Tea_Party_012_122_233lo.jpg&h=img276
https://www.imagevenue.com/view/o/?i=38151_Tricia_Helfer_at_8th_Annual_BAFTA_LA_TV_Tea_Party_1_122_392lo.jpg&h=img250
- Im Quelltext der Seite ist das Hauptbild jetzt am ID-Attribut mit dem Wert main-image auszumachen, z.B.:
- Code: Alles auswählen
<img src="https://cdno-data.imagevenue.com/html.img276/upload2328/loc233/35501_Alessandra_Torresani_8th_Annual_BAFTALA_TV_Tea_Party_012_122_233lo.jpg" id="main-image"
class="mw-100 position-absolute invisible" alt="35501_Alessandra_Torresani_8th_Annual_BAFTALA_TV_Tea_Party_012_122_233lo.jpg" style="border-radius: 8px;"/>
Meine Prüfung auf alle möglichen URIs für den Hoster ist dafür jetzt:
- Code: Alles auswählen
https?://([^.]+\.)?imagevenue\.com/(img|view)(\.php\?(loc=loc[0-9]+&)?image|/o/\?i)=.*
...und die neuste Suchvariante fürs Originalbild ist:
- Code: Alles auswählen
<img src=["']([^"'>]+)["'] id=["']main-image["'][^>]+alt=["']([^"'>]*)["']
(
$1 = Bild,
$2 = potenzieller Dateiname).
Falls BH inzwischen gut genug ist, auch diese unsäglichen "404/removed"-Bilder der Hoster zu erkennen: Für ImageVenue ist es immer ein 14396 Bytes großes JFIF, bzw. immer folgende End-URI:
- Code: Alles auswählen
https://cdno-data.imagevenue.com/no_image.jpg
Ohne solch eine Erkennung lädt man ja immer dieselben Bilder runter und hat die Annahme, dass auch alles geklappt hätte (statt die jeweils als Fehlschlag oder direkt alt tot zu deuten).