• ポートフォリオ機能


ポートフォリオを新規に作成して保存
既存のポートフォリオに追加保存

  • この表をプリントする
PDF PDFをダウンロード
審決分類 審判 査定不服 2項進歩性 特許、登録しない(前置又は当審拒絶理由) H04N
管理番号 1280311
審判番号 不服2011-22816  
総通号数 168 
発行国 日本国特許庁(JP) 
公報種別 特許審決公報 
発行日 2013-12-27 
種別 拒絶査定不服の審決 
審判請求日 2011-10-24 
確定日 2013-10-08 
事件の表示 特願2002-509274「ディジタル動画を送信機から受信機へ伝送するための方法及びシステムならびに関連するデコーダ」拒絶査定不服審判事件〔平成14年 1月17日国際公開、WO02/05540、平成16年 1月29日国内公表、特表2004-503185〕について、次のとおり審決する。 
結論 本件審判の請求は、成り立たない。 
理由 1.手続の経緯
本願は、2001年(平成13年)7月5日(パリ条約による優先権主張外国庁受理2000年7月7日、ドイツ)を国際出願日とする出願であって、平成15年3月11日付で手続補正書が提出され、 平成20年4月2日付で審査請求がなされ、平成22年10月5日付で拒絶理由の通知がなされ、平成23年3月8日付で意見書・手続補正書が提出され、平成23年6月20日付で拒絶査定がなされたものである。
本件は、上記拒絶査定を不服として平成23年10月24日付で請求された拒絶査定不服審判であって、当審において平成24年10月2日付で拒絶理由の通知がなされ、平成25年4月1日付で意見書が提出されたものである。

2.本願発明
本願の請求項1に係る発明は、平成15年3月11日付、および、平成23年3月8日付手続補正書で補正された明細書及び図面の記載からみて、特許請求の範囲の請求項1に記載された次のとおりのものと認める。(以下「本願発明」という。)

「【請求項1】 ディジタル動画を送信機から受信機へ伝送するための方法において、
a)前記ディジタル動画は前記送信機側では画像データストリームとして存在し、
b)前記画像データストリームを優先クラスに分類し、
c)前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い、前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し、
d)前記受信機側の調整層により、伝送誤りを検出し、
e)前記伝送誤りに対して前記受信機側で誤り処理を実行し、
f)伝送された誤り処理済み画像データストリームを画像デコーダに供給する、
ことを特徴とする、ディジタル動画を送信機から受信機へ伝送するための方法。」

3.平成24年10月2日付拒絶理由の概要
当審において平成24年10月2日付で通知した拒絶理由の概要は以下のとおりである。

『A.本件出願は、明細書及び図面の記載が下記の点で不備のため、特許法第36条第6項第2号に規定する要件を満たしていない。


平成23年3月8日付手続補正書で補正された請求項1?12,13,14に係る発明は明確でない。

B.本件出願は、明細書及び図面の記載が下記の点で不備のため、特許法第36条第4項第1号に規定する要件を満たしていない。


この出願の発明の詳細な説明は、当業者が平成23年3月8日付手続補正書で補正された請求項1?12,13,14に係る発明を実施することができる程度に明確かつ十分に記載されたものでない。

C.本件出願は、明細書及び図面の記載が下記の点で不備のため、特許法第36条第6項第1号に規定する要件を満たしていない。


平成23年3月8日付手続補正書で補正された請求項1?12,13,14に係る発明は、発明の詳細な説明に記載したものでない。

D.本件出願の下記の請求項に係る発明は、その出願前日本国内または外国において頒布された下記の刊行物1に記載された発明であるから、特許法第29条第1項第3号に該当し、特許を受けることができない。


平成23年3月8日付手続補正書で補正された請求項1,4,8,11,12,13,14に係る発明は下記引用例1に記載された発明である。

E.本件出願の下記の請求項に係る発明は、その出願前日本国内または外国において頒布された下記の刊行物に記載された発明に基づいて、その出願前にその発明の属する技術の分野における通常の知識を有する者が容易に発明をすることができたものであるから、特許法第29条第2項の規定により特許を受けることができない。


(あ) 上記理由Dで述べたのと同様の理由で、平成23年3月8日付手続補正書で補正された請求項1,2?4,6,8,11,12,13,14に係る発明は下記引用例1に記載された発明に基づき当業者が容易に発明できたものである。
(い) 平成23年3月8日付手続補正書で補正された請求項1?12,13,14に係る発明は下記引用例2,1に記載された発明に基づき当業者が容易に発明できたものである。

引 用 文 献 等 一 覧
1.特開平8-251596号公報
2.STEPHAN WENGER, "A High Level Syntax for H.26L: First Results", VISUAL COMMUNICATIONS AND IMAGE PROCESSING 2000, 2000.06.発行, pp.1307-1316』

4.引用刊行物,引用発明
4.1.引用例2
平成24年10月2日付拒絶理由通知の理由E(い)において引用された引用例2(STEPHAN WENGER, "A High Level Syntax for H.26L: First Results", VISUAL COMMUNICATIONS AND IMAGE PROCESSING 2000, 2000.06.発行, pp.1307-1316)には以下の記載がある。

“ABSTRACT
This paper introduces some preliminary results of the standardization process of ITU-T's H.26L project. This forthcoming video coding standard will not only significantly improve the coding efficiency, but it will also introduce new concepts such as network friendliness, which are not common in current video coding approaches. The paper focuses on the high level syntax that resides hierarchically above the macroblock layer. Data partitioning techniques are used to separate data of different types from each other. The partitions are arranged in packets of data with different importance for the reproduced picture quality. Along with unequal error protection, which can either be a function of the underlying network or implemented on the application layer, the error resilience and thus the reproduced picture quality in error prone environments is greatly improved. To verify the findings, simulation results for an Internet RTP environment, based on realworld observations of the current Internet that do not assume network-based quality of service, are included.”(第1307頁第5?14行)
(訳)「要約
この論文では、ITU-TのH.26Lの標準化手続の途中結果について紹介する。この新しい映像符号化標準は、符号化効率を著しく改良するのみならず、現在の映像符号化においてあまり一般的ではない、ネットワークとの親和性という概念を導入するものである。この論文ではマクロブロック層より上位の階層における上位の文法について焦点を当てる。データ区分技術が異なる種類のデータを分けるために用いられる。パケットの中の画像の品質に関して異なる重要性を有するデータを区分けするためにデータ区分が用いられる。用いられるネットワークの機能としての、または、アプリケーション層に組み込まれる機能としての、異なる種類の誤り訂正符号化と共に用いることによって、符号誤りが存在する環境での、誤り耐性と画像品質が大きく改善される。この結果を確認するために、ネットワーク環境でのサービス品質を想定しない現在のインターネット環境に対する実際の観察に基づいた、インターネットRTP環境におけるシミュレーション結果についても述べる。」

“2. THE TML-1 CORE ALGORITHM
The TML-1 core algorithm uses inter picture prediction, augmented by motion-compensation, and transform coding of the residual signal. In addition, it allows for transform coded intra information. These techniques are generally used in current video coders such as H.261, H.263, or by the various members of the MPEG family.
The source picture format is common with H.261. YUV 4:2:0 coded source pixels are arranged in macroblocks of 16 x 16 pixel. Each macroblock consists of 16 blocks that contain 4 x 4 pixel. These 4 x 4 pixel information, or the residual in case of inter coding, is transformed using an exact, DCT-like, integer transform. The use of the integer transform avoids rounding errors common for integer implementation of DCT-based codecs, and, therefore, allows for efficient implementation on integer processor architectures.”(第1307頁第35?43行)
(訳)「2. TML-1の中核アルゴリズム
TML-1の中核アルゴリズムは、動き補償を伴う画像間予測、残差信号についての変換符号化を用いている。それに加えて、画像内情報符号の変換も許容している。これらの技術は、H.261, H.263やその他のMPEG画像符号化のような現在の画像符号化で用いられている。
入力画像フォーマットは、H.261と同様である。YUV 4:2:0 で符号化された入力画素は16x16画素のマクロブロックに分割される。それぞれのマクロブロックは、4x4画素からなるブロックを16個含んでいる。これら4x4画素からなる情報は、または、画像間符号化の場合の残差は、離散余弦変換のような整数変換を用いて変換される。整数変換を用いることによって、離散余弦変換に基づく符号化を整数で実行するときの丸め誤差を避けることができ、整数プロセッサアーキテクチャ上での実行を効率化することができる。」

“2.1. TML-1 Syntax
TML-1 does not contain any in-picture fragmentation mechanisms such as slices or GOBs, although such mechanisms are necessary both from a delay and from error resilience point-of-view, and, therefore, will be added m the future. Syntactically, a coded picture consists of some picture header information containing information relevant for all macroblocks of a picture and the coded macroblock information.

The TML-1 syntax diagram is depicted in

Figure 2. Each block in the diagram represents one VLC-coded symbol. Many of the symbols can be skipped, as announced by MB-Type and the content of the picture header. The following syntax elements are used:
・Picture header information, including the Temporal Reference (TR), the quantizer step size (PQP), and the picture type (intra/inter, Ptype).
・MB_Type: Valid macroblock types include skip, intra, or one of the already discussed inter coding modes that differ in the number of motion vectors and the size and shape of the regions covered by those vectors.
・Intra-pred-mode: Mode of Intra prediction, not discussed further here
・MACC: Motion vector accuracy
・Ref_frame: The temporal reference of the reference picture to be used for prediction.
・MVD: motion vector data. The number of motion vectors is announced by MB_Type. For each motion vector, two symbols are conveyed.
・CBP: Coded block pattern, similar to CBPs in H.261


・Tcoeff_luma: Luminance transform coefficients. A run/level coding scheme is used, and the end of the transform coefficients for a certain block is announced by an EOB codeword, similar to H.261.
・Tcoeff_chroma_DC: DC chroma transform coefficients.
・Tcoeff_chroma_AC: AC chroma transform coefficients. The chroma transform coefficients use a different mapping of values to VLC symbols for AC and DC coefficients.

As a general rule, the types and numbers of all codewords for a coded macroblock are announced by previous codewords. The only exceptions to this rule are the transform coefficients, where an EOB symbol is used to determine the number of coefficients.”(第1308頁下から12行?第1310頁第3行)
(訳)「2.1. TML-1の文法
TML-1は、そのような機構がエラー耐性や時間遅れの観点から見て必要ではあるものの、スライスやGOBのような画像内細分化の機構は現時点では有していないが、そのような機構は将来追加される予定である。文法上、符号化された画像は、その画像の全てのマクロブロックと、符号化されたマクロブロックの情報に必要な全ての情報を含むヘッダ情報を含んでいる。
TML-1の文法に関するダイアグラムは第2図に描かれている。ダイアグラムのそれぞれのブロックは、可変長符号化されたシンボルを示している。殆どのシンボルは、マクロブロックの種類や画像ヘッダで宣言することにより、省略することができる。以下の文法要素が用いられている。
・Picture header information, 時間参照(TR), 量子化幅(PQP), 画像種別(画像内符号化/画像間符号化, Ptype)を含む。
・MB_Type: スキップ、画像内符号化、その他既に議論された符号化種別を表し、動きベクトルの数、動きベクトルの対象となる領域の大きさと形を変化させる。
・Intra-pred-mode: 画像内予測の種別を表す。これ以上これについては議論しない。
・MACC: 動きベクトルの精度。
・Ref_frame: 予測に用いられる参照画像に関する時間参照。
・MVD: 動きベクトルのデータ. 動きベクトルの数はMB_Typeで宣言される. それぞれの動きベクトルにつき、2つのシンボルが送られる。
・CBP: Coded block pattern, H.261のCBPに類似するコード化ブロックパターン。
・Tcoeff_luma: 輝度に関する変換係数. レベル符号化ないしランレングス符号化が用いられる。H.261と同様に、そのブロックの変換係数の終了はEOBで宣言される。
・Tcoeff_chroma_DC: クロマに関する直流変換係数。
・Tcoeff_chroma_AC: クロマに関する交流変換係数。クロマに関する変換係数では交流係数と直流係数で異なる可変長符号化を用いている。」

“3. AN ERROR RESILIENT, HIGHLEVEL SYNTAX FOR TML1
3.1. History, Assumptions and Constraints
During the Red Bank meeting of Q15/16 in October 1999, a breakout group chaired by the author discussed an approach for a network friendly, error resilient high level syntax for TML1. At the starting point of our discussions it was observed that, when using TML1 type - or any other common type - of video coding, there are certain dependencies of various data types. If, for example, the picture header with its picture type information is lost, then it is very difficult or even impossible to make use of any macroblock data, even if such data is undamaged. When the macroblock type information is missing, then it is impossible to decode that macroblock because it is unclear how the following symbols should be interpreted. It might even be possible to partly reconstruct a coded picture even if some less important parts are missing.
Data partitioning in the video coding is the appropriate tool to separate information of various data types from each other. Instead of having all symbols representing a coded macroblock concatenated together, symbols from all macroblock of a given data type are concatenated together and conveyed as a whole. That is, for example, that all MB_Type symbols for all macroblocks form a MB_Type partition. Similarly, there are partitions for all other syntax elements. This allows separating important from less important data, which in turn helps to appropriately apply unequal error protection schemes. The main disadvantage of data partitioning is the added delay on bandwidth limited links, because the decoding of the first macroblock can only start once all partitions are received. On packet networks, however, this is much less an issue, because, typically, only complete packets are conveyed to the application, and those packets often have to be rather large (containing the whole picture) due to overhead/payload relationship constraints. We, therefore, decided that the high level syntax should make intensive use of data partitioning.
It was further observed that even under real-time constraints it is possible to abstract from bit error prone environments by applying some form of protocol support that ensures a bit error free, but packet lossy environment. Therefore, and due to time constraints, the breakout group considered only packet lossy environments. To facilitate the discussions we focused on an Internet IP/UDP/RTP environment, with its well known characteristics. These characteristics can be summarized as follows: a packet lossy environments with packet loss rates of up to 20% or more, no bit errors within packets, and packet sizes of up to 1500 bytes, which is the MTU size of the current Internet.”(第1310頁第15?39行)
(訳)「3.TML1の誤り耐性についての上位文法
3.1.歴史、想定、問題
1999年10月のRedbankで行われたQ15/Q16についての会議における、著者が議長をした分科会において、ネットワーク親和性があり、誤り耐性のあるTML1のための上位文法が議論された。議論の最初において、TML1型の、または、それ以外の通常の符号化においては、種々のデータ種別間に依存性があることが想定された。例えば、もし、画像種別が含まれる画像ヘッダが失われると、マクロブロックデータが全く破壊されていなくても、マクロブロックデータを利用することは非常に難しいか全く不可能となる。マクロブロック種別情報が失われたときには、それに続くシンボルをどのように解釈してよいかわからないから、マクロブロックを復号することは不可能である。しかし、より重要ではない情報が失われたときには、符号化された画像の一部を復元することが可能かもしれない。
画像符号化におけるデータ区分は、各種のデータ種別の情報を区別するのに適切な手法である。符号化されたマクロブロックを表現するシンボル全てをひとまとめとする代わりに、符号化されたマクロブロックのあるデータ種別を表現するシンボルをひとまとめにして一体として送る。それは、例えば、すべてのマクロブロックについてのMB_Typeについてのシンボルによって、MB_Type区分を形成する。同様に、他の全ての文法要素の区分を設ける。より重要な情報と重要でない情報を区分することによって、異なる誤り訂正符号化を適切に適用することができる。データ区分についての最も大きな問題は、全ての区分を受信しない限り最初のマクロブロックを復号することができないことによって、限られた帯域を有する通信路で遅れを付加してしまうことである。しかしながら、パケット交換網では、完成したパケットのみがアプリケーションに渡され、通常、そのパケットはオーバーヘッドやペイロードの問題で全体の画像を含むような十分な大きさを有しているから、これは大きな問題とはならない。したがって、上位文法はデータ区分に用いられるように決定された。
更に、リアルタイムであるべき状況でも、ビット誤りを除去するなんらかのプロトコルを適用することによって、ビット誤りがある環境に対処することはできるものの、パケットが失われる環境に対処することはできないことが認められた。そのため、時間の問題から、分科会ではパケットが失われる環境についてのみ検討することとなった。議論を促進するため、その特徴が良く知られているInternet IP/UDP/RTP環境についてのみ検討することとなった。その特徴とは、パケット損失率が20%ないしそれ以上となる環境であること、パケットに関してはビット誤りのないこと、現在のInternetにおけるMTUの大きさである1500byteをパケットの最大の大きさとすること、である。」

“3.3. Data partitioning
To facilitate implementation work and to be flexible in the future for different packetization schemes, the decoder generates an output file format, which contains the data partitioned, VLC coded symbols in a packet format. Each partition consists of a header containing information about type, size, and picture ID of the partition, and the partition data. This interim format is intended to be the input to the packetization process. The overhead is 12 bytes per partition plus typically 4 but maximal of 7 bits to achieve byte alignment of the VLC coded symbols. The maximum number of partitions per picture is 10, as there are only 10 types of data (see section TML-1 Syntax above for the description of the data types). Therefore, the overhead per coded picture compared to original TML-1 syntax is 124 bytes. This corresponds to roughly 25% overhead for the realistically chosen picture size/bit rate scenario later used in our simulations.

3.4. Packetization
On the Internet, real-time media data is typically conveyed using an IP/UDP/RTP protocol hierarchy. The combined header overhead per packet of these three protocols is 40 bytes per packet. Conveying each data structures generated during the partitioning process in a single packet would lead to the doubling of the bit rate, which is unacceptable. Therefore, it is necessary to reduce the number of packets per picture, and, if possible, also the overhead introduced by the partition syntax.
We identified three different groups of data types, which form a hierarchy. In particular:
・Group 1: Picture Header, MBTYPE, IntraPred, Motion Vectors
・Group 2: CBPs, IntraCoeff
・Group 3: InterCoeff
For all three groups it holds true that all data of the numerically lower groups have to be available to decode data of the numerically higher groups It is, for example, possible to use the motion vectors of group 1 along with the other information of that group, but ignore the missing group 2 coefficient data. Group 2 data, however, is needed to reconstruct group 3, as CBPs are necessary to reconstruct inter coefficients as well.
In order to facilitate implementation work, and as group 2 is typically very small, we for now ignored the potential additional benefits of using three groups, and settled for only two groups, each of which is conveyed in a single RIP packet:
・'First' packet: contains Picture Header, MBTYPE, IntraPred, Motion Vectors
・'Second' packet: contains CBPs and all coefficients
Using only two packets per picture reduces the packetization overhead to 80 bytes per picture.
To further reduce the overhead, the information concerning each partition that was generated by the partitioning process has to be reduced. To do so a 'part of partition' packet (POP-packet) is introduced. A POP-packet consists of a 16 bit header and partition data as indicated by the header. As there are only 10 different data types, we expressed the partition type information in 4 bits. In an RIP environment the picture ID can easily be reconstructed out of the RIP timestamp and, therefore, is not coded again. The remaining 12 bits of a 16 bit POP header field are used for the partition size information, measured in bits. This would allow for partitions up to 4096 bits, when using the value 0 as an indication for a size of 4096 bits. Since sometimes, especially when coding intra pictures, partitions can be bigger than 4096 bits, a value of 0 for the size also indicates that there is another POP packet of the same data type following somewhere in the packet.
The MTU size of the Internet is, due to historic reasons, roughly 1500 bytes, although all involved protocols theoretically allow for packet sizes up to 64 kbyte. In case of intra pictures, the size of all POP packets of the intra coefficients will often exceed the MTU size. We did not consider such a situation in our simulations, as there is a need for some picture segmentation mechanism on the source coding level, for example similar to MPEG slices, necessary in the future anyway, and that mechanisms could be employed to generate packets of reasonable size.
Figure 3 depicts the resulting packet structure assuming all partitions containing less than 4096 bits yielding one POP packet,
except the Inter Coefficients partition which contains 6000 bits resulting in the need of two POP packets.


3.5. De-packetization
The de-packetization process is straightforward. If the received packet is a 'First' packet, which can be either identified by parsing the POP-header structure or by checking RTP's marker bit, then another packet is read. If that packet is the 'Second' packet of the same picture, which has to be checked using the RTP timestamp, then the partitions of both packets can be conveyed to the decoder. If the 'First' packet is missing, then the received 'Second' packet is not conveyed to the decoder, as the decoder will be unable to use any of the bits of that packet If the second packet is missing, then only the 'First' packet is conveyed to the decoder. The decoder uses the unavailability of symbols of the second packet to trigger the use of error concealment.

3.6. Reconstruction and concealment
The reconstruction process follows exactly the algorithms defined in TML1, except when the symbols of the second packets are missing. In this case, when the decoder requests a CBP information, a codeword provided by the bitstream handling module that indicates that none of the blocks contains coefficients. This prevents the decoder from expecting coefficients that are due to the packet loss no more available. The low-level part of the decoder thus 'sees' only a picture that contains motion vectors, but no coefficients, in its inter macroblocks. While the loss of the residual signal certainly leads to picture degradation, that degradation is surprisingly low, as discussed in the simulation results.”(第1310頁下から7行?第1312頁第15行)
(訳)「3.3.データ区分
適用を促進すると共に、将来パケット化の手法が異なったときにも対応できるように、デコーダは、データ区分され、可変長符号化されたシンボルを含むパケットを含むフォーマットの出力ファイルを生成する。それぞれのデータ区分は、種別に関する情報を含むヘッダ、大きさ、そのデータ区分の画像ID、および区分されたデータを含む。この中間フォーマットは、パケット化処理の入力に用いられる。データ区分当たり12byte、および、可変長符号化されたシンボルの位置合わせのために平均的には4bit、最大7bitのオーバヘッドを有する。上記『TML1文法』にみられるように、10種類のデータがあるので、画像当たりのデータ区分は最大10となる。したがって、元のTML-1文法に比べ、画像当たりのオーバーヘッドは124byteとなる。これは、シミュレーションにおいて用いられる実際の画像の大きさ/ビットレートの約25%のオーバーヘッドとなる。

3.4.パケット化
インターネットでは、リアルタイムのデータは、IP/UDP/RTPプロトコルを用いて階層的に通常送られる。これら3つのプロトコルによるオーバーヘッドはパケット毎40byteである。データ区分処理によって生成された個々のデータ構造を一つのパケットで送ると、ビットレートを倍にする必要があり、それを受け入れることはできない。したがって、画像当たりのパケットを減らすことが必要であり、また、可能であればデータ区分文法によるオーバーヘッドも減らす必要がある。
データ種別を階層構造となる以下の3つのものに区分けする。
・グループ1: Picture Header, MBTYPE, IntraPred, Motion Vectors
・グループ2: CBPs, IntraCoeff
・グループ3: InterCoeff
これら3つのグループでは、数値的に小さなグループが、数値的に大きなグループのデータを復号するために必要である。たとえば、グループ1の動きベクトルをそのグループの他の情報と共に用いつつも、失われたグループ2の変換係数を無視することができる。しかしながら、グループ2のデータは、CBPがInterCoeffを再構成するの必要なように、グループ3のデータを再構成するのに必要である。
適用を容易とするために、また、グループ2は通常非常に小さいこともあり、今のところ、3つのグループを用いることによる利点の可能性を無視して、それぞれ一つのRTPパケットで送られる以下の2つのグループを用いることとした。
・第1パケット: Picture Header, MBTYPE, IntraPred, Motion Vectorsを含む
・第2パケット: CBPs と全ての coefficientsを含む
画像1枚あたり2つのパケットのみを用いることによって、パケット化によるオーバーヘッドを画像当たり80byteに押さえることができる。
更にオーバーヘッドを減らすために、データ区分処理で生成されるそれぞれの区分毎の情報を減らす必要がある。そのために、『データ区分の一部』パケット(POP packet)を導入する。POP パケットは、16ビットのヘッダとそのヘッダで種別が表される情報を含んでいる。10種類のデータ種別が存在するので、データ区分種別は4bitで表現される。RTPを用いる環境では、画像IDはRTPタイムスタンプから簡単に再構成出来るので、それは符号化されない。16bitのPOP packetのヘッダの残り12bitは、bitで表現されるデータ区分の大きさに関する情報に用いられる。0を4096bitを表現するために用いることによって、データ区分の最大の大きさは4096bitとなる。画像内符号化された画像を送るときに、データ区分が4096bitを越えることがあるため、0は同じデータ種別のPOP packet が同じパケット内で後続していることを示す。
用いられているプロトコルのいずれも理論的には64kbyteのパケットを許容するにも係わらず、MTUの大きさは、歴史的な理由で約1500byteである。画像内符号化された画像では、画像内符号の係数を含むPOP packetの大きさがしばしばMTUの大きさを超える。適切な大きさのパケットを生成するための、MPEGのスライスと同様なソースコードレベルの画像分割手法が必要となるが、いずれにしろ将来必要となるから、このシミュレーションでは、このような状況を検討しない。
第3図は、画像内符号化の係数のみが6000bitを含み2つのPOP packetを必要とし、それ以外のすべてのデータ区分が4096bit以下で1つのPOP packetで構成される時のパケット構造を示している。

3.5.パケット復号
パケットの復号は容易である。もし、受信したパケットが、POPヘッダを解析するか、RTPマーカービットをみることによって、第1パケットであると確認できれば、次のパケットを読む。そのパケットが、RTP時刻を確認することによって、同じ画像の第2パケットであると判断されれば、双方のパケットのデータ区分がデコーダに送られる。もし第1パケットが失われていれば、第2パケットはデコーダには送られず、デコーダはそのパケットのいずれのビットも利用することができない。もし第2パケットが失われている場合には、第1パケットのみがデコーダに送られる。デコーダは、第2パケットのデータシンボルを利用不可能であることにより、誤り修復処理を起動する。

3.6.再構築および修復
再構築処理は、第2パケットのデータシンボルが失われた時を除いて、TML-1で定義されたアルゴリズムを忠実に実現するものである。この場合、デコーダがCBP情報を要求したときに、ビットストリーム処理モジュールは変換係数が無いことを示すコードワードを供給する。これは、パケットが失われたことにより、デコーダが変換係数を要求することを防ぐ。そのため、デコーダの下位部分は、動きベクトルはあるものの変換係数のない画像を得る。残差信号を失うことは当然画質の低下を招くが、シミュレーション結果が示すように、その低下は非常に少ない。」

ここで、上記記載を検討する。

第一に、上記“This paper introduces some preliminary results of the standardization process of ITU-T's H.26L project. This forthcoming video coding standard will not only significantly improve the coding efficiency, but it will also introduce new concepts such as network friendliness, which are not common in current video coding approaches.”(第1307頁第6?8行、訳「この論文では、ITU-TのH.26Lの標準化手続の途中結果について紹介する。この新しい映像符号化標準は、符号化効率を著しく改良するのみならず、現在の映像符号化においてあまり一般的ではない、ネットワークとの親和性という概念を導入するものである。」)との記載からみて、引用例2記載の発明は「動画像符号化方法」に関するものである。
第二に、上記“The source picture format is common with H.261. YUV 4:2:0 coded source pixels are arranged in macroblocks of 16 x 16 pixel.”(第1307頁下から5?4行、訳「入力画像フォーマットは、H.261と同様である。YUV 4:2:0 で符号化された入力画素は16x16画素のマクロブロックに分割される。」)との記載からみて、引用例2記載の発明は「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする」ものである。
第三に、“3.3. Data partitioning To facilitate implementation work and to be flexible in the future for different packetization schemes, the decoder generates an output file format, which contains the data partitioned, VLC coded symbols in a packet format. Each partition consists of a header containing information about type, size, and picture ID of the partition, and the partition data. This interim format is intended to be the input to the packetization process. The overhead is 12 bytes per partition plus typically 4 but maximal of 7 bits to achieve byte alignment of the VLC coded symbols. The maximum number of partitions per picture is 10, as there are only 10 types of data (see section TML-1 Syntax above for the description of the data types). Therefore, the overhead per coded picture compared to original TML-1 syntax is 124 bytes. This corresponds to roughly 25% overhead for the realistically chosen picture size/bit rate scenario later used in our simulations.”(第1310頁下から7行?第1311頁第3行、訳「3.3.データ区分 適用を促進すると共に、将来パケット化の手法が異なったときにも対応できるように、デコーダは、データ区分され、可変長符号化されたシンボルを含むパケットを含む出力ファイルフォーマットを生成する。それぞれのデータ区分は、種別に関する情報を含むヘッダ、大きさ、そのデータ区分の画像ID、および区分されたデータを含む。この中間フォーマットは、パケット化処理の入力に用いられる。データ区分当たり12byte、および、可変長符号化されたシンボルの位置合わせのために平均的には4bit、最大7bitのオーバヘッドを有する。上記『TML1文法』にみられるように、10種類のデータがあるので、画像当たりのデータ区分は最大10となる。したがって、元のTML-1文法に比べ、画像当たりのオーバーヘッドは124byteとなる。これは、シミュレーションにおいて用いられる実際の画像の大きさ/ビットレートの約25%のオーバーヘッドとなる。」)との記載、および、この“3.3. Data partitioning”の“see section TML-1 Syntax above for the description of the data types”との記載で引用されている上記 “Figure 2: TML-1 Syntax Diagram”、および、上記摘記した第1308頁下から12行?第1310頁第3行の記載からみて、引用例2記載の発明は「符号化された情報は、Picture header information, MB_Type, Intra-pred-mode, MACC, Ref-frame, MVD, CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC という最大10の部分に区分けされ可変長符号化され」たものである。
第四に、上記“This interim format is intended to be the input to the packetization process.”(第1310頁下から4?3行、訳「この中間フォーマットは、パケット化処理の入力に用いられる。」)との記載、上記“3.4. Packetization On the Internet, real-time media data is typically conveyed using an IP/UDP/RTP protocol hierarchy. The combined header overhead per packet of these three protocols is 40 bytes per packet. Conveying each data structures generated during the partitioning process in a single packet would lead to the doubling of the bit rate, which is unacceptable. Therefore, it is necessary to reduce the number of packets per picture, and, if possible, also the overhead introduced by the partition syntax.”(第1311頁第3?7行、訳「3.4.パケット化 インターネットでは、リアルタイムのデータは、IP/UDP/RTPプロトコルを用いて階層的に通常送られる。これら3つのプロトコルによるオーバーヘッドはパケット毎40byteである。データ区分処理によって生成された個々のデータ構造を一つのパケットで送ると、ビットレートを倍にする必要があり、それを受け入れることはできない。したがって、画像当たりのパケットを減らすことが必要であり、また、可能であればデータ区分文法によるオーバーヘッドも減らす必要がある。」)との記載、上記“In order to facilitate implementation work, and as group 2 is typically very small, we for now ignored the potential additional benefits of using three groups, and settled for only two groups, each of which is conveyed in a single RIP packet: ・'First' packet: contains Picture Header, MBTYPE, IntraPred, Motion Vectors ・'Second' packet: contains CBPs and all coefficients”(第1311頁第16?19行、訳「適用を容易とするために、また、グループ2は通常非常に小さいこともあり、今のところ、3つのグループを用いることによる利点の可能性を無視して、それぞれ一つのRTPパケットで送られる以下の2つのグループを用いることとした。・第1パケット: Picture Header, MBTYPE, IntraPred, Motion Vectorsを含む ・第2パケット: CBPs と全ての coefficientsを含む」)との記載、および、“Figure 3: A coded picture consists of two packets, each of which contains POP packets of various data types”の記載からみて、引用例2記載の発明は「最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、第2パケットに分けて、IP/UDP/RTPプロトコルで送」るものである。更に、上記“・'Second' packet: contains CBPs and all coefficients”との記載、“Figure 3: A coded picture consists of two packets, each of which contains POP packets of various data types”の記載からは「第2パケット」が CBP とすべての coefficients を含むことが読み取れるが、“Figure 2: TML-1 Syntax Diagram”からは、このすべての coefficients とは、Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC であり、それらが Figure 2 に記載される順番で含まれることを読み取ることができるから、「第2パケット」は「CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む」ものである。すなわち、引用例2記載の発明は「最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、IP/UDP/RTPプロトコルで送」るものである。
第五に、上記“3.5. De-packetization The de-packetization process is straightforward. If the received packet is a 'First' packet, which can be either identified by parsing the POP-header structure or by checking RTP's marker bit, then another packet is read. If that packet is the 'Second' packet of the same picture, which has to be checked using the RTP timestamp, then the partitions of both packets can be conveyed to the decoder. If the 'First' packet is missing, then the received 'Second' packet is not conveyed to the decoder, as the decoder will be unable to use any of the bits of that packet If the second packet is missing, then only the 'First' packet is conveyed to the decoder. The decoder uses the unavailability of symbols of the second packet to trigger the use of error concealment.”(第1312頁第1?8行、訳「3.5.パケット復号 パケットの復号は容易である。もし、受信したパケットが、POPヘッダを解析するか、RTPマーカービットをみることによって、第1パケットであると確認できれば、次のパケットを読む。そのパケットが、RTP時刻を確認することによって、同じ画像の第2パケットであると判断されれば、双方のパケットのデータ区分がデコーダに送られる。もし第1パケットが失われていれば、第2パケットはデコーダには送られず、デコーダはそのパケットのいずれのビットも利用することができない。もし第2パケットが失われている場合には、第1パケットのみがデコーダに送られる。デコーダは、第2パケットのデータシンボルを利用不可能であることにより、誤り修復処理を起動する。」)との記載、特に、“If the received packet is a 'First' packet, which can be either identified by parsing the POP-header structure or by checking RTP's marker bit, then another packet is read. If that packet is the 'Second' packet of the same picture, which has to be checked using the RTP timestamp, then the partitions of both packets can be conveyed to the decoder.”(訳「もし、受信したパケットが、POPヘッダを解析するか、RTPマーカービットをみることによって、第1パケットであると確認できれば、次のパケットを読む。そのパケットが、RTP時刻を確認することによって、同じ画像の第2パケットであると判断されれば、双方のパケットのデータ区分がデコーダに送られる。」)との記載からみて、引用例2記載の発明は「第1パケット、第2パケットの順」で送信し「受信した第1パケットと第2パケットを組み合わせてデコーダに送る」ものである。
第六に、上記“Data partitioning in the video coding is the appropriate tool to separate information of various data types from each other. Instead of having all symbols representing a coded macroblock concatenated together, symbols from all macroblock of a given data type are concatenated together and conveyed as a whole. That is, for example, that all MB_Type symbols for all macroblocks form a MB_Type partition. Similarly, there are partitions for all other syntax elements. This allows separating important from less important data, which in turn helps to appropriately apply unequal error protection schemes.”(第1310頁第24?28行、訳「画像符号化におけるデータ区分は、各種のデータ種別の情報を区別するのに適切な手法である。符号化されたマクロブロックを表現するシンボル全てをひとまとめとする代わりに、符号化されたマクロブロックのあるデータ種別を表現するシンボルをひとまとめにして一体として送る。それは、例えば、すべてのマクロブロックについてのMB_Typeについてのシンボルによって、MB_Type区分を形成する。同様に、他の全ての文法要素の区分を設ける。より重要な情報と重要でない情報を区分することによって、異なる誤り訂正符号化を適切に適用することができる。」)との記載からみて、引用例2記載の発明は「部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行う」ものである。

したがって、引用例2には以下の発明(以下「引用発明1」という。)が記載されている。

「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする動画符号化方法において、
符号化された情報は、Picture header information, MB_Type, Intra-pred-mode, MACC, Ref-frame, MVD, CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC という最大10の部分に区分けされ可変長符号化され、
最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、第1パケット、第2パケットの順で、IP/UDP/RTPプロトコルで送り、
受信した第1パケットと第2パケットを組み合わせてデコーダに送るものであって、
部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行う動画符号化方法。」

4.2.引用例1
平成24年10月2日付拒絶理由通知の理由E(い)において引用された引用例1(特開平8-251596号公報)には以下の記載がある。

「【0001】
【産業上の利用分野】本発明は、動画像信号を高能率に圧縮符号化する動画像符号化装置および圧縮符号化信号を復号化して元の動画像信号を再生する動画像復号化装置に係り、特に伝送路/蓄積媒体での誤りに強い動画像符号化/復号化装置に関する。」
「【0002】
【従来の技術】TV電話、TV会議システム、携帯情報端末、ディジタルビデオディスクシステムおよびディジタルTV放送システムなどのように動画像信号を伝送/蓄積するシステムにおいては、動画像信号をできるだけ少ない情報量に圧縮符号化し、得られた圧縮符号化信号である符号列を伝送路/蓄積媒体へ伝送/蓄積し、伝送/蓄積された符号列を復号化することによって元の動画像信号を再生する。」
「【0004】ところで、このようにして動画像信号を符号化して得られた符号列を無線伝送路のような誤りが生じやすい媒体を介して伝送/蓄積する場合、復号化側で再生される画像信号が伝送/蓄積の際の誤りにより劣化してしまうことがある。このような誤りの対策として、例えば誤り確率の異なる複数の伝送路を介して符号列を伝送できる条件下では、誤りによる画質劣化を少なくするため、符号列をいくつかの階層に分けて、上位階層の符号列はより誤り確率の低い伝送路で伝送を行う階層的符号化方式が知られている。階層の切り分けとしては、モード情報、動き補償情報、画像信号の低周波成分を上位階層とし、画像信号の高周波数成分を上位階層とする方法等が提案されている。」
「【0009】予測回路12からは、予測に関わる情報として予測モード/動きベクトル情報26が出力され、可変長符号化回路27により可変長符号化される。可変長符号化回路21,27から出力される符号列は、マルチプレクサ30により多重化されるとともに、上位階層符号列31および下位階層符号列32に分けられ、図示しない伝送路/蓄積媒体へ出力される。すなわち、上位階層符号列31は伝送/蓄積による誤りが生じる確率が比較的低い伝送路/蓄積媒体に出力され、下位階層符号列32は伝送/蓄積による誤りが生じる確率が比較的高い伝送路/蓄積媒体に出力される。」
「【0016】
【課題を解決するための手段】第1の発明に係る動画像符号化装置は、入力動画像信号を上位段階から下位段階にわたって順次より多くの領域に段階的に分割し、各段階で分割された領域毎に該入力動画像信号に対する予測を行って予測信号を得る予測手段と、この予測手段により得られた最下位段階での予測信号の予測残差信号を生成する予測残差生成手段と、この予測残差生成手段により生成された予測残差信号を符号化する第1の符号化手段と、前記予測手段における前記各段階での予測に関わる情報を符号化する第2の符号化手段と、前記第1の符号化手段および前記第2の符号化手段により得られた符号列を階層的符号列として出力するものであって、前記第2の符号化手段により得られた符号列については上位段階ほどより上位階層の符号列として出力する符号列出力手段とを具備することを特徴とする。」
「【0027】図1において、入力動画像信号101はまず予測回路102での予測に供される。すなわち、予測回路102においては入力動画像信号101とフレームメモリ103に蓄えられている既に符号化/局部復号化によって得られた参照画像信号との間の動きベクトルが検出され、この動きベクトルに基づいて動き補償予測信号が作成される。予測回路102は、動き補償予測モード(フレーム間予測モード)と入力動画像信号101をそのまま符号化するフレーム内予測モードを持っており、符号化に最適な予測モードを選択して、それぞれのモードに対応する予測信号104を出力する。すなわち、予測回路102は動き補償予測モードでは動き補償予測信号、フレーム内予測モードでは“0”を予測信号104としてそれぞれ出力する。」
「【0031】ここで、符号列を誤り確率が異なる複数の伝送路/蓄積媒体を介して伝送/蓄積を行うことが可能な条件下では、上位階層符号列121についてはより誤り確率の低い伝送路/蓄積媒体を介して伝送/蓄積を行い、下位階層符号列122についてはこれより誤り確率の高い伝送路/蓄積媒体を介して伝送/蓄積を行うことにより、上位階層符号列121にはできるだけ誤りが生じにくいようにする。また、符号化列121,122に対して誤り訂正符号化を行う場合には、上位階層符号化列121は下位階層符号化列122に比べて誤り率が低くなるように、より強力な誤り訂正符号化を行う。」
「【0036】図3は、上位階層符号列121および下位階層符号列122の構成例を示したものである。図3(a)に示す上位階層符号列121には、1符号化フレーム毎またはある領域単位毎に、先頭に一意に復号化可能な同期符号を入れる。PSCがフレーム単位の同期符号を示している。この同期符号PSCの後ろには、当該フレームの符号化情報を示すピクチャヘッダをつける。ピクチャヘッダは、当該フレームの時間的位置を示すフレーム番号、当該フレームの予測モードを示す情報(モード情報)、当該フレームの上位階層および下位階層それぞれの符号列の長さを示す情報(符号量)からなる。」
「【0037】さらに、図3(a)に示すようにピクチャヘッダに大領域および小領域の大きさと動き補償の画素精度を示す情報(大領域MC精度、小領域MC精度)を追加すれば、動き補償の精度をフレーム単位に可変化して動きベクトル情報の符号量を制御することが可能になる。これにより、伝送路/蓄積媒体等の制約で上位階層符号列121と下位階層符号列122の符号量の割合が規定されている場合にも、それに対応した符号量振り分けが可能である。また、各フレームの動きベクトル情報の総符号量の制御もできるため、動き補償精度と動きベクトル情報の符号量の関係からみて最適な動き補償精度を選択することが可能であり、それによって符号化効率の向上を図ることができる。」
「【0038】図3(a)に示す上位階層符号列121のピクチャヘッダの後ろには、各領域の符号化情報が重要度の高い情報から順番に並べられている点が特徴的である。ここで重要度の高い情報とは、誤りが生じると復号画像に大きな劣化が生じてしまう情報のことである。すなわち、上位階層符号列121のピクチャヘッダの後ろには、まず最も重要度の高い予測モードを示す情報(モード情報)、つまり予測回路102から出力される大領域予測モード/動きベクトル情報116および小領域予測モード情報117を可変長符号化回路118で符号化して得られた符号列のうちの予測モード情報の符号列を入れる。」
「【0039】次に、フレーム内予測モードが選択された領域のDCT係数情報のDC成分(イントラDC)、つまり予測残差信号106をDCT回路107および量子化回路109を通して得たDCT係数情報を可変長符号化回路111で符号化して得られた符号列のうちのDC成分の符号列を入れる。さらに、動き補償予測モードが選択された領域では、大まかな動き情報を示す大領域動きベクトル情報(大領域MV)、つまり予測回路102から出力される大領域予測モード/動きベクトル情報116を可変長符号化回路118で符号化して得られた符号列のうちの動きベクトル情報の符号列を入れる。」
「【0040】一方、図3(b)に示す下位階層符号列122には、小領域の動きベクトル情報(小領域MV)、つまり予測回路102から出力される小領域予測モード/動きベクトル情報117を可変長符号化回路119で符号化して得られた符号列のうちの動きベクトル情報の符号列を入れ、さらにその後ろにDCT係数情報の高周波成分、つまり予測残差信号106をDCT回路107および量子化回路109を通して得たDCT係数情報を可変長符号化回路111で符号化して得られた符号列のうちの高周波成分の符号列を入れる。」
「【0041】このように動き補償予測を階層化して行い、予測モードを示すモード情報や大まかな予測情報を示す大領域動きベクトル情報を上位階層符号列121に、また精細な動きベクトル情報を下位階層符号列122にそれぞれ割り当てている。従って、伝送路/蓄積媒体での誤りによって下位階層符号列122に含まれる小領域動きベクトル情報が失われた場合でも、動画像復号化装置では上位階層符号列121に含まれる大領域動きベクトル情報を用いて大まかな精度で動き補償予測を行うことができるため、復号画像に大幅な画質劣化が生じる確率を低くすることができる。」
「【0042】また、本実施例では上位および下位の各階層符号列121,122内でも符号列を重要な情報の順に並べているため、重要でない情報で生じた誤りが重要な情報にまで波及することが無く、大幅な画質劣化を防ぐことができる。」
「【0047】誤り判定回路220は、デマルチプレクサ203および可変長復号化回路207,208,209の状態に基づいて上位階層符号列201および下位階層符号列202の誤りの有無を判定し、その判定結果を予測回路217に与える。誤り判定回路220で上位および下位階層符号列201,202のいずれにも誤りが検出されなかった場合、予測回路217はフレームメモリ218に記憶されている参照画像信号を基にして、図1における予測信号104と同一の予測信号219を出力する。」
「【図1】


「【図3】



第一に、上記段落【0001】の記載からみて、引用例1に記載される発明は「伝送路での誤りに強い動画像符号化/復号化装置」である。
第二に、上記段落【0016】の記載からみて、引用例1に記載される発明は「入力動画像信号を上位段階から下位段階にわたって順次より多くの領域に段階的に分割し、上位段階ほどより上位階層の符号列として出力」するものである。
第三に、上記段落【0031】には「上位階層符号列121についてはより誤り確率の低い伝送路を介して、ないし、強力な誤り訂正符号化を行って伝送を行い、下位階層符号列122についてはこれより誤り確率の高い伝送路を介して、ないし、弱い誤り訂正符号化を行って伝送を行うこと」が記載されていると認めることができる。
第四に、上記段落【0041】【0042】の記載からは、「下位階層符号列122に含まれる情報より上位階層符号列121に含まれる情報がより重要であり、上位階層符号列121、下位階層符号列122内でも情報を重要な順に並べていること」を読み取ることができる。

すなわち、引用例1には以下の発明(以下「引用発明2」という。)が記載されている。

「伝送路での誤りに強い動画像符号化/復号化装置において、
入力動画像信号を上位段階から下位段階にわたって順次より多くの領域に段階的に分割し、上位段階ほどより上位階層の符号列として出力し、
下位階層符号列122に含まれる情報より上位階層符号列121に含まれる情報がより重要であり、上位階層符号列121、下位階層符号列122内でも情報を重要な順に並べ、
上位階層符号列121についてはより誤り確率の低い伝送路を介して、ないし、強力な誤り訂正符号化を行って伝送を行い、下位階層符号列122についてはこれより誤り確率の高い伝送路を介して、ないし、弱い誤り訂正符号化を行って伝送を行う、
動画像符号化/復号化装置。」

5.対比
本願発明と引用発明1を対比する。

5.1.「ディジタル動画を送信機から受信機へ伝送するための方法において・・・ことを特徴とする、ディジタル動画を送信機から受信機へ伝送するための方法。」
引用発明1は「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする動画符号化方法」であって「最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、第1パケット、第2パケットの順で、IP/UDP/RTPプロトコルで送り、受信した第1パケットと第2パケットを組み合わせてデコーダに送るもの」であるから、引用発明1と本願発明は「ディジタル動画を送信機から受信機へ伝送するための方法において・・・ことを特徴とする、ディジタル動画を送信機から受信機へ伝送するための方法」である点で一致する。

5.2.「a)前記ディジタル動画は前記送信機側では画像データストリームとして存在し」
引用発明1は「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする」ものであって、この「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像」は「画像データストリーム」であるということができるから、引用発明1と本願発明は「a)前記ディジタル動画は前記送信機側では画像データストリームとして存在し」である点で一致する。

5.3.「b)前記画像データストリームを優先クラスに分類し、c)前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い、前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」
本願発明の「優先クラス」という用語の意味について、また、「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い、前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」との記載の意味について、本願の明細書および図面に基づいて以下検討する。

5.3.1.「優先クラス」という用語の意味について
本願の明細書には以下の記載がある。

「【0011】
特に有利な作用は、優先クラスへの分類と調整層による伝送との組合せから得られる。これにより、画像データストリーム内のデータが優先順位に従って送信機から受信機へ伝送され、受信機側には情報内容の最も多いデータから順に到着することが保証される。このことから、初めのうち動画は受信機側において一定の最低品質で表示可能であることが保証される。さらに伝送されるデータはとりわけ逐次的な品質改善に使用されるので、伝送誤りが存在する場合には、この時点で、少なくとも以前に伝送された画像データが利用可能であり、伝送誤りは以降伝送される画像には影響しないことが保証されている。」
「【0037】
それに応じて、エンコーダ101側のブロック102では、優先クラスへのパーティショニングが行われる。すなわち、画像データストリームが要素ごとに優先クラスへと順序づけされる。下記の形態を有する例えばH.26Lからの画像データストリーム」
「【0038】
【外1】


「【0039】
を出発点として、下記の優先クラスへのパーティショニングが実行される:
1:PSYNC(“Picture Sync”、画像同期化)
PTYPE(“Picture Type”,画像タイプ)
2:MB_TYPE1…MB_TYPEn(“Macroblock-Type”,1つのフレーム/スライス内に現れるすべての要素)
3:CBP1…CBPn(“Coded Block Pattern”,符号化されたブロックパターン)
4:MVD1…MVDn(“Motion Vector Difference”,動きベクトル差)
5:LUM1…LUMn(“Luminance Coefficient”,輝度値)
6:CHR_DC1…CHR_DCn(“DC-Chrominance Coefficient”,DCクロミナンス値)
7:CHR_AC1…CHR_ACn(“AC-Chrominance Coefficient”、ACクロミナンス値)
上記の優先クラス1?7は例示的なものであり、優先クラス1が最も優先度の高いクラスである。画像データストリームの優先クラスへのパーティショニング(ブロック102を参照)の後、調整層(ブロック103及び104)において、(誤りのある)伝送チャネルを介した伝送がトリガされる。図1では、ブロック103にはUMTSネットワークに対する調整層が示されており、ブロック104にはIPネットワーク(インターネットプロトコル)に対する調整層が示されている。ここで大きな利点は、使用される各ネットワークに依存して、このネットワークの独特のサービス品質特性を利用しうることにある。サービス品質特性は調整層へネットワークにより通知される。さらに、デコーダ110側では、どの調整層が手元にあるかをエンコーダ101に通知してもよく、その結果、使用可能なネットワークが相応して使用される(リターンチャネル112及び114を参照)。調整層は、優先クラスへと順序づけられた画像データをRTPパケットにパッキングし、これを(様々な方式で、例えばパケット交換方式で)デコーダ110側の各調整層(ブロック107及び108を参照)へ伝送する。画像データストリームは参照番号111及び113により表示されている。」
「【0042】
とりわけ、下位の各優先クラスは上位の優先クラスへの従属性を示す。上位の優先クラスのデータが失われると、失われた情報が以前の画像から推測可能でないかぎり、失われたクラスの要素に従属するそれよりも下位の優先クラスはもはや評価不能になる(“error concealment”(誤りの潜伏))。この推測が成功すればするほど、個々の画像情報はますます相関してくる(しかし、符号化効率はより低くなる)。」

ここで、上記段落【0011】の「特に有利な作用は、優先クラスへの分類と調整層による伝送との組合せから得られる。これにより、画像データストリーム内のデータが優先順位に従って送信機から受信機へ伝送され」との記載からみて、本願発明の「優先クラス」は「画像データストリーム内のデータが優先順位に従って送信機から受信機へ伝送され」るためのものであり、上記段落【0042】の「とりわけ、下位の各優先クラスは上位の優先クラスへの従属性を示す。上位の優先クラスのデータが失われると、失われた情報が以前の画像から推測可能でないかぎり、失われたクラスの要素に従属するそれよりも下位の優先クラスはもはや評価不能になる(“error concealment”(誤りの潜伏))。」との記載からみて、本願発明の「優先クラス」では「上位の優先クラスのデータが失われると、失われた情報が以前の画像から推測可能でないかぎり、失われたクラスの要素に従属するそれよりも下位の優先クラスはもはや評価不能になる」という意味で「下位の各優先クラスは上位の優先クラスへの従属性を示す」ものである。そして、この「優先クラス」とは具体的には上記段落【0039】に記載されるように、

「1:PSYNC(“Picture Sync”、画像同期化)
PTYPE(“Picture Type”,画像タイプ)
2:MB_TYPE1…MB_TYPEn(“Macroblock-Type”,1つのフレーム/スライス内に現れるすべての要素)
3:CBP1…CBPn(“Coded Block Pattern”,符号化されたブロックパターン)
4:MVD1…MVDn(“Motion Vector Difference”,動きベクトル差)
5:LUM1…LUMn(“Luminance Coefficient”,輝度値)
6:CHR_DC1…CHR_DCn(“DC-Chrominance Coefficient”,DCクロミナンス値)
7:CHR_AC1…CHR_ACn(“AC-Chrominance Coefficient”、ACクロミナンス値)」

となる場合を含んでいる。

5.3.2.「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」との記載の意味について
本願の明細書には、上記『5.3.1.「優先クラス」という用語の意味について』で摘記したものに加え、以下の記載がある。

「【0003】
これに関連してさらに、ディジタル動画シーケンスを含んだ画像データストリームを、情報内容の多い情報がまず第一に伝送されるように、送信機から受信機へ伝送することも公知である。これは、いわゆる優先クラスの使用により適切に行われ、これに基づいて動画シーケンスの情報内容が分類される。したがって、優先クラスに依存して画像データを伝送することにより、画像データストリーム内で情報内容の多いデータをまず第一に受信機に伝送することが可能である。詳細は文献[1]、[2]又は[3]から知ることができる。」
「【0036】
図1には、動画を符号化するためのエンコーダ101が示されている。符号化された動画は(できるだけ圧縮して、つまりリソースを大事に)デコーダ110に伝送される。なお、デコーダ110は有利には符号化規格に従って、例えばMPEGー4又はH.263に従って動作する。このために、プロトコルアーキテクチャの拡張がなされており、ブロック102?104はエンコーダ側に、ブロック107?109はデコーダ側に含まれる。このプロトコルアーキテクチャの拡張は、デコーダ110がトランスペアレントに付加的サービスを使用できるようにすること、つまり誤りに対して耐性があり且つ誤り処理の為された画像データストリームを供給することを目的としている。これに関して、1つには、伝送チャネル(105又は106)を介して優先クラスを考慮しつつ伝送を行うと有利である。つまり、情報内容の多い情報をまず伝送し、さらに、チャネルの伝送誤りを識別及び処理することにより、動画シーケンスを介して伝播しビデオ品質を著しく損なうビット誤りをデコーダ110が受け取らないようにすると有利である。」
「【0040】
調整層により伝達されるこのようなパケットは、例えば下記の構造を有している:
1:PSYNC,PTYPE,MB_TYPE1…MB_TYPEn,CBP1…CBPn,MVD1…MVDn(優先クラス1?4)
2:LUM1…LUMn(優先クラス5)
3:CHR_DC1…CHR_DCn(優先クラス6)
4:CHR_AC1…CHR_ACn(優先クラス7)
ここでもまた、動画シーケンスの各画像にとって最も重要な情報は優先クラス1?4にまとめられていることが明らかである。説明については上を見よ。輝度値(グレー値、ルミナンス値)は優先クラス5にまとめられており、クロミナンス値(優先クラス6及び7)に先行して伝送される。デコーダはこのようなパケットを受け取ると、画像が始まること、この画像がどのタイプであるかということ、画像内にオブジェクトが存在するかどうかを識別し、オブジェクトが存在する場合には、符号化方式(ブロック内にDCTがあるか否か)及び動きベクトル情報を識別する。その直後に、輝度値、つまり実際の画像情報が伝送される。色情報は輝度情報より遅れて伝送される;やむをえない場合には、画像は色情報なしで識別可能である。」

ここで、上記段落【0040】の「デコーダはこのようなパケットを受け取ると、画像が始まること、この画像がどのタイプであるかということ、画像内にオブジェクトが存在するかどうかを識別し、オブジェクトが存在する場合には、符号化方式(ブロック内にDCTがあるか否か)及び動きベクトル情報を識別する。その直後に、輝度値、つまり実際の画像情報が伝送される。色情報は輝度情報より遅れて伝送される;やむをえない場合には、画像は色情報なしで識別可能である。」との記載、特に「その直後に、輝度値、つまり実際の画像情報が伝送される。」との記載からみて、本願明細書では、「輝度値」「クロミナンス値」については「実際の画像情報」として取り扱っているのに対し、それ以外の「動きベクトル」等は「実際の画像情報」として取り扱っていないものと認められる。そして、上記段落【0040】の「輝度値(グレー値、ルミナンス値)は優先クラス5にまとめられており、クロミナンス値(優先クラス6及び7)に先行して伝送される。」との記載からみて、この「実際の画像情報」である「輝度値」は「クロミナンス値」に対して先行して伝送されるものであるが、YUV 4:2:0のように輝度情報に比べクロミナンス情報を間引いた動画像符号化が周知であることからみて、結局、この「実際の画像情報」の中で「輝度値」は「クロミナンス値」に対して先行して伝送するとは、「実際の画像情報」の中で最も情報量の多い「輝度値」がまず伝送されるということとなる。

すなわち、本願発明の「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」の「前記優先クラスに基づいて動画データのソートを行い」における「動画データ」とは、本願明細書に記載された発明における「実際の画像情報」である「輝度値」「クロミナンス値」を指し、本願発明の「優先クラスに基づいて動画データのソートを行い」とは、本願明細書に記載された発明における「実際の画像情報」である「輝度値」に付与された「優先クラス5」、「クロミナンス値」に付与された「優先クラス6及び7」に基づいて「優先クラス5」である「輝度値」が「優先クラス6及び7」である「クロミナンス値」に対して先行するようにソートを行うことを指し、本願発明の「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送される」とは、その結果、本願明細書に記載された発明における「実際の画像情報」の中で最も情報量の多い「輝度値」がまず伝送されることを言うと解釈すべきものである。

5.3.3.「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」との記載の意味について
本願明細書及び図面には、上記『5.3.1.「優先クラス」という用語の意味について』『5.3.2.「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」との記載の意味について』で摘記したものに加え、以下の記載がある。

「【0041】
ネットワークを介した伝送は、ネットワーク特有の特性を利用して行われる。図1には、インターネットプロトコルネットワークとUMTSネットワークとが例として示されている。これらネットワークの各々は妨害の影響下にあることもあり、その際には、パケットの喪失が生じかねない。デコーダ側の調整層(ブロック107及び108を参照)はこのようなパケット喪失を検出する。ブロック109は、優先クラスの分配による画像データストリームのディパーティショニング、つまり再構成を引き受け、失われてしまった情報に対する誤り処理を実行する。最後に、結果がデコーダ110に引き渡される。デコーダ110が規格化された画像デコーダであってもよいように、優先クラスへの分類ないしディパーティショニングのサービス、及び上記誤り処理は、デコーダ110に対してトランスペアレントに提供される。」
「【図1】



ここで、上記段落【0039】の「画像データストリームの優先クラスへのパーティショニング(ブロック102を参照)の後、調整層(ブロック103及び104)において、(誤りのある)伝送チャネルを介した伝送がトリガされる。図1では、ブロック103にはUMTSネットワークに対する調整層が示されており、ブロック104にはIPネットワーク(インターネットプロトコル)に対する調整層が示されている。ここで大きな利点は、使用される各ネットワークに依存して、このネットワークの独特のサービス品質特性を利用しうることにある。サービス品質特性は調整層へネットワークにより通知される。」「調整層は、優先クラスへと順序づけられた画像データをRTPパケットにパッキングし、これを(様々な方式で、例えばパケット交換方式で)デコーダ110側の各調整層(ブロック107及び108を参照)へ伝送する。」との記載、上記段落【0040】の「調整層により伝達されるこのようなパケットは、例えば下記の構造を有している: 1:PSYNC,PTYPE,MB_TYPE1…MB_TYPEn,CBP1…CBPn,MVD1…MVDn(優先クラス1?4) 2:LUM1…LUMn(優先クラス5) 3:CHR_DC1…CHR_DCn(優先クラス6) 4:CHR_AC1…CHR_ACn(優先クラス7)」との記載、上記段落【0041】の「ネットワークを介した伝送は、ネットワーク特有の特性を利用して行われる。図1には、インターネットプロトコルネットワークとUMTSネットワークとが例として示されている。これらネットワークの各々は妨害の影響下にあることもあり、その際には、パケットの喪失が生じかねない。」「ブロック109は、優先クラスの分配による画像データストリームのディパーティショニング、つまり再構成を引き受け、失われてしまった情報に対する誤り処理を実行する。」との記載からは、『「1:PSYNC,PTYPE,MB_TYPE1…MB_TYPEn,CBP1…CBPn,MVD1…MVDn(優先クラス1?4)」「2:LUM1…LUMn(優先クラス5)」「3:CHR_DC1…CHR_DCn(優先クラス6)」「4:CHR_AC1…CHR_ACn(優先クラス7)」という優先クラスで分類された画像データストリームを含むパケットは、優先クラスに応じて異なるネットワーク、異なるプロトコルで、送信側の調整層から受信側の調整層へ伝送される』ということが読み取れる。
すなわち、本願発明の「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」とは、「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを優先クラスに応じて異なるネットワークの異なるプロトコルを用いて前記受信機へ伝送し」と解釈すべきものである。

5.3.4.「b)前記画像データストリームを優先クラスに分類し」に関する対比
上記『5.3.1.「優先クラス」という用語の意味について』で述べたように、本願発明の「優先クラス」は「画像データストリーム内のデータが優先順位に従って送信機から受信機へ伝送され」るためのものであり、この「優先クラス」は「上位の優先クラスのデータが失われると、失われた情報が以前の画像から推測可能でないかぎり、失われたクラスの要素に従属するそれよりも下位の優先クラスはもはや評価不能になる」という意味で「下位の各優先クラスは上位の優先クラスへの従属性を示す」ものである。

ここで、引用発明1は「符号化された情報は、Picture header information, MB_Type, Intra-pred-mode, MACC, Ref-frame, MVD, CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC という最大10の部分に区分けされ可変長符号化され」るものであるから、引用発明1と本願発明は「前記画像データストリームを」「クラスに分類」する点で一致している。
また、本願発明の「優先クラス」は、上記したように「上位の優先クラスのデータが失われると、失われた情報が以前の画像から推測可能でないかぎり、失われたクラスの要素に従属するそれよりも下位の優先クラスはもはや評価不能になる」という意味で「下位の各優先クラスは上位の優先クラスへの従属性を示す」が、これに対し引用発明1の「最大10の部分に区分けされ可変長符号化された情報」は「部分に区分けされた情報のうち、重要な情報と重要でない情報」を有するものであって、引用例2の“For all three groups it holds true that all data of the numerically lower groups have to be available to decode data of the numerically higher groups It is, for example, possible to use the motion vectors of group 1 along with the other information of that group, but ignore the missing group 2 coefficient data. Group 2 data, however, is needed to reconstruct group 3, as CBPs are necessary to reconstruct inter coefficients as well.”(第1311頁第12?15行、訳「これら3つのグループでは、数値的に小さなグループが、数値的に大きなグループのデータを復号するために必要である。たとえば、グループ1の動きベクトルをそのグループの他の情報と共に用いつつも、失われたグループ2の変換係数を無視することができる。しかしながら、グループ2のデータは、CBPがInterCoeffを再構成するの必要なように、グループ3のデータを再構成するのに必要である。」)との記載からみて、引用発明1で区分けされた「最大10の部分」と本願発明の「優先クラス」は、いずれも「上位の優先クラスのデータが失われると、失われた情報が以前の画像から推測可能でないかぎり、失われたクラスの要素に従属するそれよりも下位の優先クラスはもはや評価不能になる」という意味で「下位の各優先クラスは上位の優先クラスへの従属性を示す」という点で一致している。
そして、引用発明1は「最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、第1パケット、第2パケットの順で、IP/UDP/RTPプロトコルで送」るものであって、引用発明1で区分けされた「最大10の部分」と本願発明の「優先クラス」は、いずれも「画像データストリーム内のデータが優先順位に従って送信機から受信機へ伝送され」る点で一致している。
すなわち、引用発明1で区分けされた「最大10の部分」と本願発明の「優先クラス」が一致するから、引用発明1の「符号化された情報は、Picture header information, MB_Type, Intra-pred-mode, MACC, Ref-frame, MVD, CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC という最大10の部分に区分けされ」と本願発明の「b)前記画像データストリームを優先クラスに分類し」が一致する。

5.3.5.「c)前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」に関する対比
上記『5.3.2.「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」との記載の意味について』で述べたように、本願発明の「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」の「前記優先クラスに基づいて動画データのソートを行い」における「動画データ」とは、本願明細書に記載された発明における「実際の画像情報」である「輝度値」「クロミナンス値」を指し、本願発明の「優先クラスに基づいて動画データのソートを行い」とは、本願明細書に記載された発明における「実際の画像情報」である「輝度値」に付与された「優先クラス5」、「クロミナンス値」に付与された「優先クラス6及び7」に基づいて「優先クラス5」である「輝度値」が「優先クラス6及び7」である「クロミナンス値」に対して先行するようにソートを行うことを指し、本願発明の「前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送される」とは、その結果、本願明細書に記載された発明における「実際の画像情報」の中で最も情報量の多い「輝度値」がまず伝送されることを言うと解釈すべきものである。

これに対し、引用発明1は「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする動画符号化方法において」「最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、第1パケット、第2パケットの順で、IP/UDP/RTPプロトコルで送」るものである。そして、「YUV 4:2:0で符号化され」ていること、すなわち、輝度情報に比べ色差情報を間引いた動画像符号化であることから、引用発明1におけるTcoeff_luma が含む情報内容は、Tcoeff_chroma_DC, Tcoeff_chroma_AC に比べ多いこととなり、結局第2パケットに含まれるこれらTcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC の間では、情報量の最も多いTcoeff_lumaが最初に伝送されていることとなる。

すなわち、本願発明でも引用発明1においても、クロミナンス値に比べ輝度値が先行して伝送されているから、引用発明1の「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする動画符号化方法において」「最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、第1パケット、第2パケットの順で、IP/UDP/RTPプロトコルで送」ることと、本願発明の「c)前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い」は一致している。

5.3.6.「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」に関する対比
上記『5.3.3.「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」との記載の意味について』で述べたように、本願発明の「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」とは、「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを優先クラスに応じて異なるネットワークの異なるプロトコルを用いて前記受信機へ伝送し」と解釈すべきものである。

これに対し、引用発明1は「部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行う」ものであって、異なる誤り訂正符号化は異なるプロトコルで行われるものであること、また、引用発明1は誤り訂正符号化を行うための処理を行う層を有していることは明らかであることから、引用発明1の「部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行う」と本願発明の「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」は、「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを前記受信機へ伝送し」ている点で一致しているものの、「前記優先クラスに分類された画像データストリームを前記受信機へ伝送」するときに、本願発明は「種々のネットワークの複数のプロトコル」を用いて伝送しているのに対し、引用発明1は「複数のプロトコル」のみを用いて伝送している点で相違している。

5.4.「d)前記受信機側の調整層により、伝送誤りを検出し」「e)前記伝送誤りに対して前記受信機側で誤り処理を実行し」
引用発明1は「部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行」い「IP/UDP/RTPプロトコルで送」るものであって、そのような誤り訂正符号化を行った情報を受信する側では、必ず、符号誤りを検出し誤り訂正を行うものであるから、引用発明1と本願発明は、いずれも「d)前記受信機側の調整層により、伝送誤りを検出し」「e)前記伝送誤りに対して前記受信機側で誤り処理を実行し」という処理を行う点で一致している。

5.5.「f)伝送された誤り処理済み画像データストリームを画像デコーダに供給する」
引用発明1は「受信した第1パケットと第2パケットを組み合わせてデコーダに送るもの」であるから、引用発明1と本願発明は、いずれも「f)伝送された誤り処理済み画像データストリームを画像デコーダに供給する」という処理を行う点で一致している。

5.6.一致点・相違点
上記『5.1.「ディジタル動画を送信機から受信機へ伝送するための方法において・・・ことを特徴とする、ディジタル動画を送信機から受信機へ伝送するための方法。」』から『5.5.「f)伝送された誤り処理済み画像データストリームを画像デコーダに供給する」』で述べた一致点・相違点をまとめると、本願発明と引用発明1との間の一致点・相違点は以下のとおりとなる。

[一致点]
「ディジタル動画を送信機から受信機へ伝送するための方法において、
a)前記ディジタル動画は前記送信機側では画像データストリームとして存在し、
b)前記画像データストリームを優先クラスに分類し、
c)前記画像データストリーム内で最も情報内容の多い動画データがまず前記送信機から前記受信機へ伝送されるように、前記優先クラスに基づいて動画データのソートを行い、前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを前記受信機へ伝送し、
d)前記受信機側の調整層により、伝送誤りを検出し、
e)前記伝送誤りに対して前記受信機側で誤り処理を実行し、
f)伝送された誤り処理済み画像データストリームを画像デコーダに供給する、
ことを特徴とする、ディジタル動画を送信機から受信機へ伝送するための方法。」

[相違点]
「前記優先クラスに分類された画像データストリームを前記受信機へ伝送」するときに、本願発明は「種々のネットワークの複数のプロトコル」を用いて伝送しているのに対し、引用発明1は「複数のプロトコル」のみを用いて伝送している点。

6.当審の判断
上記「4.1.引用例2」で摘記したように、引用例2に記載される引用発明1は、

「YUV 4:2:0で符号化され、16×16ピクセルをマクロブロックとするフォーマットの動画像を入力とする動画符号化方法において、
符号化された情報は、Picture header information, MB_Type, Intra-pred-mode, MACC, Ref-frame, MVD, CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_AC という最大10の部分に区分けされ可変長符号化され、
最大10の部分に区分けされ可変長符号化された情報を、Picture header information, MB_Type, Intra-pred-mode, MVDをその順序で含む第1パケットと、CBP, Tcoeff_luma, Tcoeff_chroma_DC, Tcoeff_chroma_ACをその順序で含む第2パケットに分けて、第1パケット、第2パケットの順で、IP/UDP/RTPプロトコルで送り、
受信した第1パケットと第2パケットを組み合わせてデコーダに送るものであって、
部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行う動画符号化方法。」

であり、上記「4.2.引用例1」で摘記したように、引用例1に記載される引用発明2は、

「伝送路での誤りに強い動画像符号化/復号化装置において、
入力動画像信号を上位段階から下位段階にわたって順次より多くの領域に段階的に分割し、上位段階ほどより上位階層の符号列として出力し、
下位階層符号列122に含まれる情報より上位階層符号列121に含まれる情報がより重要であり、上位階層符号列121、下位階層符号列122内でも情報を重要な順に並べ、
上位階層符号列121についてはより誤り確率の低い伝送路を介して、ないし、強力な誤り訂正符号化を行って伝送を行い、下位階層符号列122についてはこれより誤り確率の高い伝送路を介して、ないし、弱い誤り訂正符号化を行って伝送を行う、
動画像符号化/復号化装置。」

である。また、上記『5.3.3.「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」との記載の意味について』で述べたように、本願発明の「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」とは、「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを優先クラスに応じて異なるネットワークの異なるプロトコルを用いて前記受信機へ伝送し」と解釈すべきものである。

まず、引用発明1と引用発明2はいずれも「動画像符号化」に関するものという点で同一の技術分野に属するものである。更に、引用発明1は「部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行う」ものであるのに対し、引用発明2は「下位階層符号列122に含まれる情報より上位階層符号列121に含まれる情報がより重要であり、上位階層符号列121、下位階層符号列122内でも情報を重要な順に並べ、上位階層符号列121についてはより誤り確率の低い伝送路を介して、ないし、強力な誤り訂正符号化を行って伝送を行い、下位階層符号列122についてはこれより誤り確率の高い伝送路を介して、ないし、弱い誤り訂正符号化を行って伝送を行う」ものであるから、引用発明1と引用発明2は、いずれも、情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行うもの、すなわち、重要な情報と重要でない情報で異なるプロトコルを用いるものという点で同一の技術分野に属するものである。

そして、引用発明2は「上位階層符号列121についてはより強力な誤り訂正符号化を行って伝送を行い」「下位階層符号列122についてはこれより弱い誤り訂正符号化を行って伝送を行う」のみならず、「上位階層符号列121についてはより誤り確率の低い伝送路を介して伝送を行い」「下位階層符号列122についてはこれより誤り確率の高い伝送路を介して伝送を行う」もの、すなわち、重要な情報と重要でない情報で異なるネットワークを用いて伝送を行うものでもあって、よりよい結果を得るために、これら2つを重ねて用いることは当業者が自然に考えつくものであるから、引用発明2にもとづき、引用発明1において「部分に区分けされた情報のうち、重要な情報と重要でない情報で異なる誤り訂正符号化を行」うのみならず、重要な情報と重要でない情報で異なるネットワークを用いることによって、「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを優先クラスに応じて異なるネットワークの異なるプロトコルを用いて前記受信機へ伝送し」とした点、すなわち、「前記送信機側の調整層により、前記優先クラスに分類された画像データストリームを種々のネットワークの複数のプロトコルを用いて前記受信機へ伝送し」とした点は、当業者が容易に想到し得たことにすぎない。

そして、本願発明の作用効果も当業者が予測できる範囲のものである。

したがって、本願発明は引用発明1,2に基づいて当業者が容易に発明できたものである。

7.むすび
以上のとおり、請求項1に係る発明は、引用例2,1に記載された発明に基づいて、当業者が容易に発明をすることができたものであるから、特許法第29条2項の規定により特許を受けることができない。

したがって、残る請求項2?14に係る発明について検討するまでもなく、本願は拒絶をすべきものである。

よって、結論のとおり審決する。
 
審理終結日 2013-05-10 
結審通知日 2013-05-13 
審決日 2013-05-24 
出願番号 特願2002-509274(P2002-509274)
審決分類 P 1 8・ 121- WZ (H04N)
最終処分 不成立  
前審関与審査官 岩井 健二  
特許庁審判長 松尾 淳一
特許庁審判官 奥村 元宏
千葉 輝久
発明の名称 ディジタル動画を送信機から受信機へ伝送するための方法及びシステムならびに関連するデコーダ  
代理人 篠 良一  
代理人 アインゼル・フェリックス=ラインハルト  
代理人 高橋 佳大  
代理人 星 公弘  
代理人 久野 琢也  
代理人 二宮 浩康  

プライバシーポリシー   セキュリティーポリシー   運営会社概要   サービスに関しての問い合わせ