PAGE TOP

取り組み

gawkでクロス集計する、その集計時間を計算してみた

gawkでクロス集計する、その集計時間を計算してみた

ちょっと読む
さぼ郎

過去、何回かに渡って「gawk」の連想配列を使って単純集計とクロス集計する関数などを検討してきました。テキスト加工において、かくも簡単に変換したり集計したりできるツールで、「awk」より優れているツールは見当たりません。その理由の一...

続きを読む

gawkを使ってデータの必要部分を取り出す

gawkを使ってデータの必要部分を取り出す

ちょっと読む
さぼ郎

今回のミッションを簡単に説明します。約86,000件のデータの中に17ヶ所、983レコードを挿入します。挿入する983レコードは36,678レコードのファイルから見つけ出さなければなりません。挿入する場所が17ヵ所程度なら、17箇所分9...

続きを読む

gawkでクロス集計に挑戦

gawkでクロス集計に挑戦

ちょっと読む
さぼ郎

gawk出クロス集計をしてみます。データ量が少なければExcelのピボットテーブルなどを駆使するとか、あるいは、売っているスマートなクロス集計ソフトもたくさんあります。ここでは、gawkを使ってクロス集計をしてみることにします。ただ...

続きを読む

トラッキングコードをgawkで埋め込む

トラッキングコードをgawkで埋め込む

ちょっと読む
さぼ郎

Googleアナリティクスというのにチャレンジしています。1.Googleにアカウントを登録する2.Googleアナリティクスにアカウントを登録する3.トラッキングコードを設置と、まるで別世界の言葉のようですが、ともかく言われるままに、...

続きを読む

gawkの連想配列を工夫してみた

gawkの連想配列を工夫してみた

ちょっと読む
さぼ郎

古いと言われている「awk」です。繰り返しになりますが、この「awk」は、ストリームエディタと言って、1行ずつテキストデータを取り込んで、必要に応じた加工をして出力するという処理をします。いたって簡単な記述で、結構なことができます。...

続きを読む

VBAで自動化を図る

VBAで自動化を図る

ちょっと読む
さぼ郎

【前の話】下記の表の若干の説明。1列目のデータは、ある内容を持つコードで、内容の出現数が2列めの数値です。3列目は、同じ種類で異なる内容を持つコードになります。その出現数が4列の値です。1列目のコードと3列目のコードを並べることで、それ...

続きを読む

gawkを使う《その2》

gawkを使う《その2》

ちょっと読む
さぼ郎

沢山のコードのデータがあって、重複をカウントしながらユニークにするような処理を考えてみます。【A】のデータ1381692073S007431391300000277S010111861300000277S01011186130000...

続きを読む

gawkを使う《その1》

gawkを使う《その1》

ちょっと読む
さぼ郎

大昔からある言語に「awk」というのがあります。名称は、開発者であるアルフレッド・エイホ、ピーター・ワインバーガー、ブライアン・カーニハンの3人の苗字の頭文字を取って付けられた と書かれています。いつ作られたかというと、「1970年代後...

続きを読む