TVgids OFFline... :-(

Zoals jullie wellicht al gemerkt hebben, werkt de TV gids momenteel niet meer.

Voor ongeveer een jaar werkte alles min of meer zoals het hoorde.
De grabber haalde zijn gegevens op van teveblad.be, en de resulterende data had dan ook netjes een bronvermelding.

Teveblad publiceert data op het internet, ik converteer die data naar een ander formaat.
Simpel. Er zijn een hele hoop (soms betalende) services die dergelijke dingen doen. (Faxen naar PDF, HTML naar PDF, Word naar HTML, vertalingen van sites, enz...)

Het is nooit de bedoeling geweest om te pretenderen dat die data van "mij" kwam, en het is al zeker geen commerciëel product waar ik op de een of andere reden een "winst" uit maak.

Doorheen dit jaar zijn er een aantal probleempjes geweest met de correcte parsing van de pagina's, omdat teveblad.be zelf heel vaak geen correcte HTML is.
De vele opmerkingen en suggesties die op het forum en per mail gemeld werden waren hiervoor erg welkom en dit zorgde ervoor dat de parser steeds beter werd.

Toch wilde ik niet afhankelijk zijn van teveblad.be als enige source.
Er zijn daarom in het verleden reeds een aantal pogingen ondernomen om de parser "multi-source capable" te maken.
Helaas was dat niet zo eenvoudig:

  • Hoe zeg ik dat "Buren" in de ene gids hetzelfde is als "Neighbours" in een andere?
  • Hoe zeg ik dat het programma dat in de ene gids begint om 19:38h, eigenlijk exact hetzelfde programma is dat in de andere gids om 19:40h begint?
  • En zo zijn er nog een hele resem van inconsistenties die opgevangen moeten worden, vaak per bron.

De "multi-source" capable parser is daardoor nooit een feit geworden.

Toch is mijn parser een "stabiel" product.
Reeds enige tijd geleden heeft Teveblad.be een poging ondernomen om roet in het eten te gooien door bepaalde XMLID's te wijzigen. (Bijvoorbeeld van NGC.)
Helaas voor hen was mijn parser hier tegen bestand, deze gebruikt namelijk exact dezelfde ID's als Teveblad zelf gebruikt. Geheel automatisch.
Helaas moest de gebruiker dan wel zelf de ID's veranderen...

Daarna is men begonnen met bepaalde tekst toe te voegen aan hun samenvatting van de TV programma's. "Het gebruik van software om gegevens te extraheren uit deze website voor persoonlijk gebruik of voor weergave op een andere website ('screen scraping') is verboden." stond er overal te lezen als laatste regel. (Een melding die overgens nooit in de Mythportal.be TV gids is verschenen, omdat Teveblad dat op een wel erg idiote manier geïmplementeerd heeft. Ofwel was mijn parser weer te goed geschreven... ;-) )

Toch vind ik geen enkele wettekst terug die me dit zou verbieden.
Misschien maak ik wel een inbreuk op de Belgische copyright wetgeving. Is dat zo? Geen idee. De server staat niet in België, dus welke wetgeving is van toepassing?
Ik ben geen jurist, dus laat ik dat wel over aan andere mensen om dat uit te zoeken moest iemand er ook een probleem van maken.

Het feit is echter dat "Sanoma Magazines", de eigenaar van Teveblad, helemaal geen copyright heeft op deze data, omdat de data simpelweg niet van hen is. Zij hebben toestemming om deze te publiceren. That's it. Juridisch gezien heb ik dan ook niet veel te vrezen van Sanoma.

Omdat ik niet echt van (selectieve) censuur houd, en omdat ik vind dat Sanoma niet het recht heeft om voor rechter te spelen hoe hun publicaties gebruikt worden, heb ik hun blokkering omzeilt. (Hoop ik.)
Normaal zou vanaf deze nacht de TV gids weer moeten werken, ik heb hen ook om meer uitleg gevraagd.

Toch vind ik dit niet de juiste manier van werken.
Ik zou ook graag korter bij de bron zitten.
Momenteel ben ik daarom in gesprek met enkele aanbieders van dergelijke TV gids data.
Deze zal veel meer info bevatten en beter up to date zijn. (Bijvoorbeeld ieder uur.)
Dit gaat waarschijnlijk niet gratis zijn, vandaar dat ik gewoon even wil rondvragen, of mensen geïnteresseerd zijn.

De poll staat hier: http://mythportal.be/node/106
(De poll is gesloten.)

Alles lijkt te werken. De

Alles lijkt te werken. De TVgids is vanaf nu terug beschikbaar.

De gids lijkt nog steeds leeg

Johan,

Kan het zijn dat er nog steeds geen data in de file zit? Of is de nieuwe file nog niet gepubliceerd?

Groeten

discussie platform?

hoever staat het hiermee? en kunnen we niet met mc2xml werken? Ik heb handmatig mijn mythtv opgegooid om gebruik te maken van mc2xml.

Nu goed, ik dat het sowieso beter is om van 1 centraal punt (mythportal) de gids te downloaden ipv van iedereen afzonderlijk.

Is er een plaats waar wie hierover kunnen discussiëren? irc, rechtstreeks via mail. Maillisting? Ik denk dat er wel een aantal mensen willen helpen om een gids te maken die je kan aanbieden aan anderen, zonder dat die zich druk hoeven te maken over veranderingen.

mc2xml

Hallo,

Ik ken mc2xml niet. Kan er iemand mij een voorbeeld van de XML output bezorgen?

Discussies mogen hier gevoerd worden.

Concreet zit het zo:

RAW XML is beschikbaar, tegen 3000-5000 Euro per jaar, voor een beperkt aantal zenders, en enkel voor commerciële bedrijven, niet voor particulieren.
Als ik die weg zou in gaan, ben ik verplicht om een site te maken vol met reklame en ervoor te zorgen dat de data zo moeilijk mogelijk geparsed kan worden. (Zoals zo veel sites die programmagidsen aanbieden.)
Dus dat is een no go.

mc2xml is een mogelijkheid, het probleem is dat ik het development e.d. niet in de hand heb, en dus geen extra dingen kan aanbieden, tenzij ik de XML output ga aanpassen.
Als de output goed is, zie ik het echter wel zitten om deze gids (ook) te hosten.

Een idee van vroeger dat nu belangrijk begint kan worden, is om de output van meerdere parsers samen te voegen, dus dat enkel bepaalde zenders geparserd worden van een bepaalde site, en andere zenders van een andere site.
Op die manier kan de volledige programmagids nooit leeg zijn.

In ieder geval zie ik dit als het startpunt voor TVgids 2.0. ;-)

TVgids komt eraan

Alles werkt in test. Momenteel is er nog niets gepubliceerd.

Als je nog even kan wachten zal normaal de TV gids heel binnenkort (Iets na middernacht) terug beschikbaar zijn, alsof er niets is gebeurd.

Momenteel wordt er ook gebrainstormed over enkele verbeteringen die aangebracht kunnen worden.
Binnen enkele weken kunnen die misschien realiteit worden...

mc2xml

wat mc2xml doet is eigenlijk de tvgids voor media center van windows downloaden en dan omzetten naar naar een xml bestand.

Dit bestand is vrijwel zonder aanpassingen in te voeren met mythfilldatabase. Ik zeg vrijwel, omdat de xmlID natuurlijk anders zijn die diegene die tv_grab_be gebruikt.

Een tweede punt is, dat je je postcode moet opgeven en dus de genereerde xml enkel de zenders aanbiedt die overeen komen met je postcode.

Een derde punt is dat je ook nog eens moet kiezen wat je tv bron is en bij kueze van telenet analoge kabel, komen het aantal kanalen in de xml file exact overeen met eze die op de kabel zitten.

nu goed dit terzijde.

Mijn idee over een centraal aangeboden gids:

- Biedt een gids aan met alle mogelijk zenders in xml formaat

- maak een goede handleiding en ondersteun ze met een apart  deel in de site (ook forum)

- eigenlijk maakt de bron van de gids niets uit voor de gebruiker

- maak eigen xmltID's die je altijd zal blijven gebruiken en leg aan de gebruiker uit hoe in te stellen.

- omdat er een heleboel verschillende regio's zijn met een verschillend aanbod van zenders, zou het misschien niet slecht zijn om de eindgebruiker aan de hand van bv een config file, de zenders te laten kiezen die hij wilt downloaden en zo een gepaste xml te generen.

- ik denk hierbij aan al dan niet combineerde zenders, info in verschillende talen, enz ...

- biedt eveneens de channelicons aan, vanuit een eigen database.

- houdt het gratis, maar een vermelding in de gids kan mijn inziens wel.

Mijn idee over het maken van de centraal aangeboden gids:

- probeer niet op de tenen te trappen van sites (zoals teveblad), door tegen hun wil aan screenscraping te doen.

- probeer zoveel mogelijk zenders samen te krijgen, maar laat de keuze aan de eindgebruiker aan de hand van een config file.

Wat is jullie reactie? en hoe kunnen we helpen.

 

Terug off-line

Hallo
Ik merk dat de tv-gids weer off-line is. Is er enige kans dat dit terug in orde komt?