NAME

perlform - Perl 格式

DESCRIPTION 描述

Perl的一些內部機制、可以幫助我們產生一份簡單的格式化圖表。經過perl的處理,你列印的格式可以接近於你所見的外貌。它可以記錄如你現在正處在哪個頁面,每個頁面的行數與何時列印出頁面的標題。關鍵字,format() 格式函式與write()執行函式是直接引自FORTRAN語法。詳情可參閱 perlfunc。幸運的是列印的格式可讀性又有所提高。幾乎類似BASIC 的PRINT USING。可以把它想象為簡單的 nroff(1).
有如子程式與包一樣,格式只是語句的宣告,而不是執行呼叫。故它可以放在程式的任何位置(一般最好是把它們集中在一塊)。與perl的其它變數名字型別不同, 格式命名有別於一般的獨自的定義。也就是說,你有一個名為Foo的函式,它與另一個格式名稱為Foo的東西是完全不同。但是預設的格式名稱與有關連的檔案控制代碼可用相同的名字。所以預設的輸出格式名稱STDOUT,它的檔案控制代碼名稱就是STDOUT。而對預設格式名稱TEMP,它的檔案控制代碼名稱也可以是TEMP。雖然名稱一樣但兩者並不相同。
輸出格式的語法如下:
    format NAME =
    FORMLIST
    .
如省略格式名稱,格式名稱將以標準輸出STDOUT命名。而格式專案將包括了好幾個連續橫行。每一行屬於下列叄種型態之一:
1.
註釋(comment), 以符號“#”置於每行的開頭。
2.
圖案行(picture line),規定了單一行的格式化外觀。
3.
引數行, 提供一些數值以對應前面的圖案行。
圖案行的輸出效果就與我們看到的一樣,除了某些值域欄位會給相對應數值取代外,每個輸入欄位都以一個@或 ^ 控制符開頭。這些單行內的控制符不能做任何竄改取代(勿與陣列變數@混淆)。@欄位是屬於正常形態的欄位,而^欄位則用來表示可以輸入多行文字。至於該欄位則由< > 或 ⎪ 符號跟隨其後指定向左、右、或居中對齊。並同時跟據該符號的數目,輸入指定資料的長度。如變數內容超過限定長度、格式列印時會自動刪除多餘的部份。
另一種指定向右對齊方式,是使用#符號來指定一個數字欄位。如此可方便小數點定位。如果輸入值裡還包含一個換行字元(0,則僅列印出該換行字元前的資料。最後圖案行出現的@*這個特別符號標記,可以用來列印多行並且不被截掉的數值。
接下來的一行、是跟據圖案行裡的值域欄位輸入相應的數值。如果是利用運算式提供數值的話、必須以逗號分隔。因為所有的表示法都會被當成一個串連內容再行處理。所以一個單一的串列表示法也可產生多個串列資料。如果表示法是利用括號圍起,可能會展開好幾行。若想如是安排,第一行的第一個單字必須是以左括號開始。如果運算式內有小數點的數字型別須要處理、同時圖案行的相關符號也指出小數位須列印出來(除了圖案行內的包含小數點"."的數字控制符號#外)。小數點列印出的外貌, 以當地的執行版本決定(LC_NUMERIC locale)。也就是說、在德文地區使用小數格示輸出時、小數點的顯示將是","而非"."。相關資料請參考 perllocale 與 "警告"
圖案行裡的欄位如果以^控制符開頭、格式將會作特殊化處理。如果該欄位是註解欄位又沒定義其值、欄位將以空白取代。若是其它型態、則視為一種填補資料的狀態。 在此、我們不能隨便填入任意表示法進去。相反、必須以相關的變數輸入字串內容。perl會盡量將文字放入該欄位、然後把字串的前面部份刪去。當你下次使用該字串變數時、可以使用後面的字串部份(換句話說、在執行write函式時、字串變數的內容是會改變的)。正常情況下、你必須使用一類似垂直狀的堆塊來放置要輸入的文字、以便整齊列印出一柱狀文字。如你列印的文字太長、想以"..."取代過長的文字時、你可以藉由更改 $: 變數值來取代分隔字元。也就是當你使用ENGLISH模組時的 $FORMAT_LINE_BREAK_CHARACTERS的意思。
使用^符號欄位可產生不定長度的記錄欄位。如果要列印的文字很短、你想壓縮掉文字後的空白、請在想壓縮掉的空白地方加上一個"~"控制符號。如果重複使用兩個"~"符號、則該行會被重複列印、直到該欄位的所有文字列印完畢為止 (如你同時使用"@"值域欄位的話、切記每次要輸入不同的數值)。
列印格示標題的預設處理方法、是將正使用的格式名稱後加上_TOP字樣既可。其內容將會列印至每頁的開頭部份。請參考 perlfunc/write 函式
例如:
 # a report on the /etc/passwd file
 format STDOUT_TOP =
                         Passwd File
 Name                Login    Office   Uid   Gid Home
 ------------------------------------------------------------------
 .
 format STDOUT =
 @<<<<<<<<<<<<<<<<<< @⎪⎪⎪⎪⎪⎪⎪ @<<<<<<@>>>> @>>>> @<<<<<<<<<<<<<<<<<
 $name,              $login,  $office,$uid,$gid, $home
 .
 # a report from a bug report form
 format STDOUT_TOP =
                         Bug Reports
 @<<<<<<<<<<<<<<<<<<<<<<<     @⎪⎪⎪         @>>>>>>>>>>>>>>>>>>>>>>>
 $system,                      $%,         $date
 ------------------------------------------------------------------
 .
 format STDOUT =
 Subject: @<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
          $subject
 Index: @<<<<<<<<<<<<<<<<<<<<<<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
        $index,                       $description
 Priority: @<<<<<<<<<< Date: @<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
           $priority,        $date,   $description
 From: @<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
       $from,                         $description
 Assigned to: @<<<<<<<<<<<<<<<<<<<<<< ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
              $programmer,            $description
 ~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                      $description
 ~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                      $description
 ~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                      $description
 ~                                    ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<
                                      $description
 ~                                    ^<<<<<<<<<<<<<<<<<<<<<<<...
                                      $description
 .
我們也有可能在同一個輸出管道同時使用print 與 write函式。但使用時、必須修改$-的特殊內建變數值(使用English模組的話、則是使用$FORMAT_LINES-LEFT變數)。
 
Format Variables 格式變數
當前的格式名稱一向都是存放於$~這個特殊變數內($FORMAT_NAME),而每頁的開頭格式則存放在$^($FORMAT-TOP_NAME),輸出頁為$%($FORMAT_PAGE_NUMBER),每頁行數是$= ($FORMAT_LINE_PER_PAGE),自動輸出格式是放在$⎪($OUTPUT_AUTOFLUSH)、要輸出到每頁開頭部份的字串存放在$^L ($FORMAT-FORMFEED)。這些變數的有效範圍,都是以某一個檔案控制代碼為單元。因此、你必須呼叫select()函式來呼叫適當的檔案控制代碼來改變變數內容。
    select((select(OUTF),
            $~ = "My_Other_Format",
            $^ = "My_Top_Format"
           )[0]);
難看吧!這就是一般用法。如此一來、你至少可用臨是變數來存放前一個檔案控制代碼。事實上、這已是較好的作法,除了可讀性提高外、也提供你一個位置暫停程式的執行,方變你一次到位除錯。
    $ofh = select(OUTF);
    $~ = "My_Other_Format";
    $^ = "My_Top_Format";
    select($ofh);
如果你使用English模組,你甚至可以輸入英文變數名稱
    use English '-no_match_vars';
    $ofh = select(OUTF);
    $FORMAT_NAME     = "My_Other_Format";
    $FORMAT_TOP_NAME = "My_Top_Format";
    select($ofh);
但你還是要呼叫select()函式。因此我們建議你用FileHandle模組。現在你可用小寫英文字母的格式名稱來處理這些特殊變數。
    use FileHandle;
    format_name     OUTF "My_Other_Format";
    format_top_name OUTF "My_Top_Format";
好多了吧!

NOTES

因為數值行的內容可能保括任何的表示法 (我們指的是 @ 欄位而非 ^ 欄位)。因此你可使用其它函式、建立更加複雜的處理方法。好像使用 printf 函式、或自己定義的函式。列如:
    format Ident =
        @<<<<<<<<<<<<<<<
        &commify($n)
    .
在欄位輸入真正的@ 或^符號:
    format Ident =
    I have an @ here.
            "@"
    .
將整行字置中對齊:
    format Ident =
    @⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪
            "Some text line"
    .
我們並無任何內建的方法讓你指定如、某個欄位要對齊該頁面最右等諸如此類事項。但你仍然能列印出你想要的格式。跟據目前頁面直行數目,呼叫eval()函式來處理它:
    $format  = "format STDOUT = \n"
             . '^' . '<' x $cols . "\n"
             . '$entry' . "\n"
             . "\t^" . "<" x ($cols-8) . "~~\n"
             . '$entry' . "\n"
             . ".\n";
    print $format if $Debugging;
    eval $format;
    die $@ if $@;
它可能列印出下列格式外貌:
 format STDOUT =
 ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
 $entry
         ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<~~
 $entry
 .
下面是一個有點類似fmt(1)的小程式:
 format =
 ^<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<< ~~
 $_
 .
 $/ = '';
 while (<>) {
     s/\s*\n\s*/ /g;
     write;
 }
 
Footers 頁尾
雖然我們有$FORMAT_TOP_NAME來記錄每頁開頭部份的格式,卻沒有一個相對應的方法來自動指定每頁的底部格式。問題是、我們並不知到某個格式資料可能會多大,除非你真的去執行它。這是我們將來要處理的重點之一。
這是一個暫時的應用方案 如果你有一個固定大小的頁尾、你可在每次呼叫write函式前檢查變數$FORMAT_LINES_LEFT,然後自行印出該資料。
還有一個方法,就是開啟一個管道。呼叫open(MYSELF,”⎪-”) (參考 perlfunc/open() 函式)。並呼叫write函式把資料輸往MYSELF、而不是標準輸出STDOUT。然後利用子串列的標準輸入、來重新處理每頁開頭或結尾所要附加的資料部份。這雖不方便,但還是可辦到的。
 
Accessing Formatting Internals 格式處理的核心
至於低階格式的機制,你可呼叫formlin()函式直接處理$^A變數($ACCUMUNATOR)。
例如:
    $str = formline <<'END', 1,2,3;
    @<<<  @⎪⎪⎪  @>>>
    END
    print "Wow, I just stored `$^A' in the accumulator!\n";
或是設計一個子程式swrite()。它對於 write 的腳色相當於sprint 對於 print。
    use Carp;
    sub swrite {
        croak "usage: swrite PICTURE ARGS" unless @_;
        my $format = shift;
        $^A = "";
        formline($format,@_);
        return $^A;
    }
    $string = swrite(<<'END', 1, 2, 3);
 Check me out
 @<<<  @⎪⎪⎪  @>>>
 END
    print $string;

WARNINGS 警告

不當處理顯示結束格示內容的點運算子號、有時也會同時影響你的網路的電郵功能(跟據過往經驗、錯誤是必然而不能避免)。如果使用電郵輸出格式內容、你應先處理好結束格式點運算子位置。切勿放置於左邊界、以免被SMTP截去。
區域性變數(引用”my”定義變數)、在呼叫格式化輸出時不會被察覺。除非在使用區域性變數的串程內另行定義(5.001版本前並沒有區域性變數一詞)。
格式輸出是 perl 語言裡維一受制於程式設計使用地區的部分。如果當前的使用地區使用LC_NUMERIC,那小數點符號的格式化輸出必以當地方式顯示。perl 不會理會當地的所須格式,除非你呼叫了 use locale。但格式列印又不受控於use locale。因為locale 它只在使用的塊內有效。同時跟據歷史原因、格式的作用域不僅包括在塊內。進一步詳情參閱 perllocale 本地化文件。
格式輸出時、程式串內的空白符號0,相當於一個空白單元。所以你可以想像格式列印相當於先處理變數:
 $value =~ tr/\n\t\f/ /;
除非圖案行已定義、餘下的空白符號r 將強制性另印新行。

中文版維護人

小高 <[email protected]>

中文版最新更新

2001年12月9日星期日

中文手冊頁翻譯計劃

http://cmpp.linuxforum.net
 
本頁面中文版由中文 man 手冊頁計劃提供。
 
中文 man 手冊頁計劃: https://github.com/man-pages-zh/manpages-zh

Recommended readings

Pages related to perlform you should read also: