标签: 文档转换器
Pandoc是一款通用文档转换器,一个专门转换文本格式的命令行工具,支持的格式非常之多,常用的有 txt、docx、html、pdf、md、pptx,可以在许多标记和文字处理格式之间进行转换!
Pandoc是一个Haskell库,用于将一种标记格式转换为另一种格式,也是一个使用该库的命令行工具。
Pandoc可以在许多标记和文字处理格式之间进行转换,包括但不限于各种类型的Markdown、HTML、LaTeX和Word docx。有关输入和输出格式的完整列表,请参阅下面的-from和-to选项。Pandoc还可以生成PDF输出:请参见下面的创建PDF。
Pandoc的增强版Markdown包括表格、定义列表、元数据块、脚注、引用、数学等语法。请看下面的Pandoc的Markdown。
Pandoc有一个模块化的设计:它由一组读取器和一组写入器组成,前者解析给定格式的文本,并生成文档的本机表示(抽象语法树或AST),后者将本机表示转换为目标格式。因此,添加一个输入或输出格式只需要添加一个阅读器或写入器即可。用户还可以运行自定义的pandoc过滤器来修改中间AST。
由于pandoc对文档的中间表示方式不如它所转换的许多格式之间的表现力强,因此不应该期望每一种格式和每一种其他格式之间都能实现完美的转换。Pandoc试图保留文档的结构元素,但不保留格式细节,如边距大小。而且有些文档元素,如复杂的表格,可能不适合pandoc的简单文档模型。虽然从pandoc的Markdown到所有格式的转换都力求完美,但从比pandoc的Markdown更有表现力的格式转换可能会有损失。
参数说明
Pandoc 程序的命令使用方式为:
pandoc <files> <options>
其中?<files>?为输入的内容,其输入即可以来自文件,也可以来自标准输入甚至网页链接。而?<options>?为参数选项。主要的参数选项有:
-f <format>、-r <format>:指定输入文件格式,默认为 Markdown;
-t <format>、-w <format>:指定输出文件格式,默认为 HTML;
-o <file>:指定输出文件,该项缺省时,将输出到标准输出;
--highlight-style <style>:设置代码高亮主题,默认为?pygments;
-s:生成有头尾的独立文件(HTML,LaTeX,TEI 或 RTF);
-S:聪明模式,根据文件判断其格式;
--self-contained:生成自包含的文件,仅在输出 HTML 文档时有效;
--verbose:开启 Verbose 模式,用于 Debug;
--list-input-formats:列出支持的输入格式;
--list-output-formats:列出支持的输出格式;
--list-extensions:列出支持的 Markdown 扩展方案;
--list-highlight-languages:列出支持代码高亮的编程语言;
--list-highlight-styles:列出支持的代码高亮主题;
-v、--version:显示程序的版本号;
-h、--help:显示程序的帮助信息。
虽然 Pandoc 提供了用于指定输入输出格式的参数,但是很多时候该参数不必使用。Pandoc 已经足够聪明到可以根据文件名判断输入输出格式,所以除非文件名可能造成歧义,否则这两个参数都可以省略。
加载全部内容
没有该专题文章哦!
糟糕,没有相关软件!