Beste,
zag gisteren en vandaag dat mythfilldatabase een error gaf in het parsen van guide.xml
Blijkbaar staat er in de versie van 31/11 op regel 1709 een & teken. Ik heb die handmatig verwijderd, en dan lukt het wel.
Daarnaast zie ik dat er nog andere tekens niet juist gedisplayed worden. Met name afkappingstekens worden als een vierkantje in de EPG getoond.
Ik kan me voorstellen dat je script nog niet voorzien is in het vervangen van deze karakters door een set die ondersteund wordt door de characterset gebruikt door mythtv ofwel dat ik zelf een instelling van mythtv moet wijzigen en de characterset moet gebruiken die jij in je script verwacht.
Ik ben geen expert dus advies is welkom.
G
12/1 ipv 31/11 natuurlijk
12/1 ipv 31/11 natuurlijk
& in xmlgids
Hallo,
Er was inderdaad een probleem met de Mythportal TV grabber waardoor er een "&" in de uiteindelijke XML gids kwam te staan.
Mythfilldatabase doet hier inderdaad moeilijk over.
Er worden een aantal testen gedaan, ondermeer door het XML-bestand met mythfilldatabase te importeren.
Helaas is de "exitcode" van mythfilldatabase ook bij deze foutmelding "0", dus viel dit door de monitoring.
Ikzelf heb het ook op zaterdagavond gemerkt. Momenteel is dit opgelost.
Technische details:
De XML gids is UTF-8.
Dit is een formaat om "vreemde" karakters te kunnen weergeven.
De website waarvan de data komt, is helaas geen correcte HTML, hetgeen parsen veel moeilijker maakt.
In de eerste plaats moeten de karakters op de website geinterpreteerd worden, en omgezet worden naar correcte HTML.
Dit gebeurt met een lookuptable.
Daarna, wordt de HTML omgezet naar UTF-8. Dit gebeurt met een ingebouwde PHP functie: html_entity_decode( $string, ENT_QUOTES, 'utf-8')
Ik denk echter dat er een fout zit in deze functie, aangezien deze de "&" HTML-code terug omzet naar "&", hetgeen verkeerd is.
In UTF-8 wordt de "&" ook voorgesteld als "&"
UPDATE: Geen fout. Blijkbaar is "&" correcte UTF-8, maar geen correcte XML.
Er is dus nog een conversie nodig, maar je moet natuurlijk wel opletten dat je enkel "losstaande" &'s converteerd, en geen "&blah;" codes.
En blijkbaar ging het daar de mist in.
Vreemde karakters
Daarnaast zie ik dat er nog andere tekens niet juist gedisplayed
worden. Met name afkappingstekens worden als een vierkantje in de EPG
getoond.
Ik kan me voorstellen dat je script nog niet voorzien is in het
vervangen van deze karakters door een set die ondersteund wordt door de
characterset gebruikt door mythtv ofwel dat ik zelf een instelling van
mythtv moet wijzigen en de characterset moet gebruiken die jij in je
script verwacht.
Alles correct weergeven is inderdaad een beetje tricky.
Ik ga hier zeker en vast nog iets over schrijven.
Normaal gezien is de XML gids correcte UTF-8.
Dit kan je makkelijk zelf nakijken.
Als er ergens iets verkeerd mocht zijn, dan mag je dat natuurlijk steeds laten weten.
"Donna op Eén", wordt bijvoorbeeld als "Donna op E<C3><A9>n" geschreven in de XML gids. Een titel met een accent "That '70s Show" als "That <C2><92>70s Show".
Maar dan begint het pas.
Deze data wordt opgeslagen in een MySQL database. Deze DB en tables, maar ook de connectiemethode, moeten UTF-8 indersteunen.
Ook lettertypes zie gebruikt worden om de programmagids weer te geven moeten UTF-8 karakters ondersteunen.
Je ziet dat er vele factoren zijn die meespelen.
Maar hopelijk lees je binnenkort hierover meer...
En zeg natuurlijk nooit zomaar "afkappingsteken", want in UTF-8 bestaat dat niet. ;-)
Men spreekt over een:
Al deze karakters zijn verschillend, en ik hebt zelfs geen idee welke ik gebruik. ;-)
Een overzicht van karakters: http://www.columbia.edu/kermit/utf8-t1.html
Hallo allen,Ik heb dat
Hallo allen,
Ik heb dat "afkappingsteken" probleem nog eens bekeken, en ik heb een workaround geïmplementeerd.
Vanaf morgen zal dit dus opgelost zijn. (Of eerder indien je nu manueel refreshed. Gebruik dan wel "wget --no-cache ...")
Het probleem:
In de HTML heeft het "afkappingsteken" code "", hetgeen officiëel "Right single-quote" heet, en in Unicode als <C2 92> voorgesteld wordt. De MythPortal parser zette dit correct om. Je kan dit karakter hier bekijken: http://www.fileformat.info/info/unicode/char/0092/index.htm
Blijkbaar kunnen vele lettertypes dit karakter (nog) niet correct afbeelden, vandaar de "vierkantjes" die sommige van jullie zagen.
In de code zet ik nu ieder voorkomen van dit teken om in een apostrophe. (') Dit is niet zo mooi gekruld, maar recht.
http://www.fileformat.info/info/unicode/char/0027/index.htm
Als je lettertype dit niet kan afbeelden, dan is het echt wel tijd om een ander lettertype te zoeken. ;-)
Dus, als er nog tekens zijn die verkeerd afgebeeld worden, dan hoor ik dat graag, want het is natuurlijk de bedoeling dat de programmagids bruikbaar is...
It is not a suspect that
It is not a suspect that every woman and / or lady would prefer to dress in this alluring
What a lot, there's a lot of tiffany sale online s their very own cool tvs and radio stations, which will flawlessly enhance their great beauty and additionally captivating. Every body will discover a route to dress yourself in their very own fresh Womens New York Jets Jerseys that are it, along with appreciate ways functional they are really. Once you try to ask people who find themselves having magical Womens New York Giants Jerseys, anyone will indicate various symbolization to have in which tiffany. A a symbol illustration is different from the other person simple styles of tiffany pendants would be best determinatio. Typically most people slip on most of these a result of the metaphors. It may possibly exemplifies take pleasure in Women by using rounded struggle with patterns can look their along with harmony, great beauty, huge selection, healthiness, etc. Realistically they are Womens Oakland Raiders Jerseys solely views on the consumers toting. The idea of the people Tiffany boasts mens fine jewelry and see tiffany b stated above is simply a minor model earning you money are a number of morals for example the aforementioned ones. The ideas for carrying Womens San Diego Chargers Jerseys range between one person to a different. No matter what the belief, the action of presenting that amazing Womens Philadelphia Eagles Jerseys will without doubt cause them to be Womens Pittsburgh Steelers Jerseys delighted and additionally produce interesting inside presenting these products.