Balíček htmllaundry obsahuje několik užitečných metod, Pythonu na vyčištění značkování HTML nebo provádět jiné běžné změny. & Nbsp; vyčištění je dostatečně přísná, aby byl schopen vyčistit HTML vložený z MS Word nebo Apple Pages. Tento balíček obsahuje také integrační kód pro z3c.form poskytnout polí, které automaticky dezinfikovat HTML při uložení.
Implementace je založen na čistší třídy z LXML.
Vyčištění rutiny
Všechny vyčištění rutiny lze vyvolat pomocí funkce jediného dezinfikovat. Tato funkce má vstupní řetězec jako vstup a vrátí uklidila verzi tohoto řetězce. Zde je jednoduchý příklad:
>>> Z htmllaundry import dezinfekci
>>> Dezinfikovat ("Dobrý den, svět ")
'
Dobrý den, svět
'Metoda dezinfikovat bere další volitelný parametr s LXML Cleaner instance, který může být použit k používání různá pravidla filtrování. htmllaundry zahrnuje tři čističe:
& Nbsp; * htmllaundry.cleaners.DocumentCleaner, což je výchozí čistší. Tento čistič umožní nejvíce bezpečné značek, zatímco odstraňováním inline styly a nejistá značky.
& Nbsp; * htmllaundry.cleaners.LineCleaner je přísnější čistič, který umožňuje pouze několik inline prvků. To je užitečné v místech, kde chcete přijímat single-linkový vstup, například v názvech dokumentů pouze.
& Nbsp; * htmllaundry.cleaners.CommentCleaner umožňuje pouze velmi omezenou sadu prvků HTML, a je navržen tak, aby byly užitečné pro uživatele za předpokladu, připomínky.
Chcete-li jet celou cestu můžete také použít StripMarkup, aby se svlékli všechny značky z vašeho vstupu:
>>> Z htmllaundry import StripMarkup
>>> StripMarkup ("Dobrý den, svět ")
'Ahoj světe'
z3c.form integrace
Chcete-li použít integraci z3c.form byste měli používat z3cform navíc za tento balíček:
install_requires = [
& Nbsp; ....
& Nbsp; htmllaundry [z3cform]
& Nbsp; ...
& Nbsp;],
Navíc budete muset načíst ZCML. Ve vašem configure.zcml přidat řádek jako je tento:
Potom můžete použít htmlText typ pole ve vašich schémata. Například:
od zope.interface import Interface
od Zope importu schématu
od htmllaundry.z3cform import htmlText
třída iDocument (Interface):
& Nbsp; title = schema.TextLine (
& Nbsp; title = _ (u "hlava"),
& Nbsp; required = True)
& Nbsp; description = htmlText (
& Nbsp; title = _ (u "Popis"),
& Nbsp; required = True)
Vezměte prosím na vědomí, že s použitím htmlText nebudou automaticky vám widgetu WYSYWIG
Co je nového v této verzi:.
- Přidat možnost dezinfikovat zadat jinou wrap prvek nebo přeskočit balení úplně.
Co je nového ve verzi 1.9:
- Přidat MANIFEST.in do faciliate zprávy nejsou vyrobené z podvracení.
- Opravit všechny čisticí prostředky, aby se svlékli javascript. To opravuje problém 1.
Co je nového ve verzi 1.8:
- Odstranit odkaz cílovou vymáhání od hardcoded kód cestě od dezinfikovat. Díky tomu je možné využít novou možnost link_target čističe.
Co je nového ve verzi 1.7:
- Zkontrolujte, nutí cílových atributů na zevnějšku Linke konfigurovatelný přes nový Možnost link_target v čistírny. Povolit pouze tuto možnost pro CommentCleaner.
Co je nového ve verzi 1.6:.
- Správné mezery test pro balení holého textu i
Co je nového ve verzi 1.4:.
- Malé kód vyčištění
- vedoucí Strip přestávky.
Co je nového ve verzi 1.3:
- Strip všechny top level br prvky. Přestávky jsou v pořádku v blocklevel prvcích, ale neměly by být použit pro přidání svislé mezery mezi blokových elementů.
Co je nového ve verzi 1.2:.
- Fix překlep v dokumentaci
- Strip koncové přestávky.
Požadavky na :
- Python
Komentáře nebyl nalezen